Sunteți pe pagina 1din 316

Universit Nancy2

UMR ATILF-CNRS cole doctorale Langues, Temps et Socits

THSE Doctorat de luniversit de Nancy 2


(spcialit sciences du langage)

par Sbastien Haton

Analyse et modlisation de la polysmie verbale dans une perspective multilingue : le dictionnaire bilingue vu dans un miroir
Thse dirige par Jean-Marie Pierrel (Nancy 1, UMR-CNRS ATILF) et Bernard Combettes (Nancy 2, UMR-CNRS ATILF) Soutenue le 25 novembre 2006 Composition du jury Directeurs :
M. PIERREL Jean-Marie, Professeur dInformatique, Universit Henri Poincar, Nancy, UMR-CNRS ATILF M. COMBETTES Bernard, Professeur de Lettres et Sciences du Langage, Universit Nancy 2, UMR-CNRS ATILF

Rapporteurs :
M. CHAROLLES Michel, Professeur de Linguistique, Universit de Paris III, UMR-CNRS LATTICE, ENS Ulm M. FRANOIS Jacques, Professeur de Linguistique, Universit de Caen, CRISCO, FRE 2805

Examinateur :
M. APOTHLOZ Denis, Professeur de Sciences du Langage, Universit Nancy 2, UMRCNRS ATILF
1

REMERCIEMENTS
Dans le cadre institutionnel, je voudrais tout dabord remercier lensemble des personnes qui mont aid et soutenu tout au long de mon cursus universitaire et qui mont permis den arriver l aujourdhui. Merci lensemble des enseignants-chercheurs de lUFR sciences du langage de Nancy 2 pour avoir appuy ma demande de drogation pour une inscription en premire anne de DEUG et pour avoir par la suite facilit mon intgration dans leur quipe pdagogique, comme tuteur, vacataire, moniteur et enfin ATER. Merci lensemble des enseignants-chercheurs de lUFR PLISE de Strasbourg pour mavoir si aimablement accueilli dans leur giron lan dernier dans le cadre dun demi-ATER et merci galement davoir amnag mes horaires pour me permettre de terminer ma thse Nancy dans les meilleures conditions. En passant, merci mes amis Amar, Roxane et leurs deux adorables petites filles pour mavoir fait partager leur doux foyer une nuit par semaine durant cette priode. Merci lquipe pdagogique de la section Informatique de lIUT Charlemagne pour mavoir accept comme moniteur pendant deux ans et merci de mavoir fait confiance pour lenseignement de matires pointues desquelles je ntais pas vraiment spcialiste mon arrive. Merci tous les membres de lATILF sans exception. Grce eux, jai pass cinq annes trs sereines en matire de relations humaines et cela nest pas pour rien dans laccomplissement de mes recherches de doctorat. Merci Dominique pour toutes ces heures passes devant la relieuse Merci mes directeurs Jean-Marie et Bernard qui mont fort bien accompagn pendant ces cinq annes et qui ont toujours eu lintelligence de faire avec mon caractre plutt que de mimposer leurs vues et leur mode de fonctionnement. Merci galement aux professeurs et chercheurs rencontrs au hasard des congrs et des projets et qui mont manifest de la sympathie. Enfin, merci au Ministre de la Recherche qui ma octroy une allocation de recherche en 2001 sur la base de mon projet de recherche de lpoque dans le cadre du programme COGNITIQUE. Que les membres de ce projet soient galement remercis. Bien sr, mes plus profonds remerciements et toute mon affection iront ma famille et mes amis qui ont tous peu ou prou contribu me faciliter la vie pour que mes annes de doctorat soient des annes heureuses et non des annes pesantes. En disant tous mes amis et toute ma famille, je veux que toutes les personnes ainsi englobes se reconnaissent dans cet hommage. Toutefois, jai une pense trs appuye pour mon artiste prfre Vronique Lafont dont laimable prsence ma donn toute lnergie dont je manquais avant son arrive ; une pense galement pour mes parents sans qui rien naurait t possible au double sens de lexpression (ils comprendront). Et un petit coucou hilare aux deux clowns quatre pattes qui tous les soirs ddramatisent par leur accueil dlirant les petits tracas quotidiens dun doctorant en fin de thse. lisabeth, Grard et Franoise qui tenaient tre prsents.
3

TABLE DES MATIERES


REMERCIEMENTS ............................................................................................................................. 3
TABLE DES MATIERES ...................................................................................................................................... 4 TABLE DES FIGURES.......................................................................................................................................... 7 INTRODUCTION .................................................................................................................................................. 8

1. 2.
2.1 2.2

Prsentation du sujet : origine, problmatique gnrale et objectifs .................................... 9 Organisation du document.................................................................................................. 22


Des verbes diffrents ........................................................................................................................ 22 Plan gnral ...................................................................................................................................... 23

3. 1. 2.
2.1 2.2 2.3

Annexes .............................................................................................................................. 29 Un sujet vaste ..................................................................................................................... 32 Sur les notions de base ....................................................................................................... 33
Quest-ce que la polysmie ?............................................................................................................ 33 Synonymie........................................................................................................................................ 53 La place des lexies dans le lexique : dfinitions et notions .............................................................. 55

CHAPITRE I......................................................................................................................................................... 31 Problmatique et fondements thoriques .............................................................................................................. 31

3.
3.1 3.2 3.3 3.4 3.5

Le verbe au centre de l'tude .............................................................................................. 60


Dfinition ......................................................................................................................................... 60 Pourquoi les verbes ?........................................................................................................................ 63 La classification des verbes en linguistique...................................................................................... 64 La polysmie verbale........................................................................................................................ 65 Transition ......................................................................................................................................... 66

4.
4.1 4.2 4.3 4.4

Modles thoriques............................................................................................................. 67
Modles de traduction selon J. Franois........................................................................................... 67 Graphes lexicaux, graphes conceptuels ............................................................................................ 68 Quelques thories et applications en smantique lexicale ................................................................ 83 La tentation de toucher tout ........................................................................................................... 93

5. 1.
1.1 1.2

Transition............................................................................................................................ 93 Introduction de partie ......................................................................................................... 96


Prsentation ...................................................................................................................................... 96 Quelques difficults surmonter...................................................................................................... 97

CHAPITRE II ....................................................................................................................................................... 95 Outils et analyse lexicographiques : Lexiques Inverss et Construction de Champs Lexicaux et Smantiques ... 95

2.
2.1 2.2

Le lexique invers............................................................................................................... 98
Gense .............................................................................................................................................. 98 Construction des lexiques inverss (LI) ........................................................................................... 98

3.
3.1 3.2

Exploitation des donnes des dictionnaires ........................................................................ 99


Retour sur les principes dorigine..................................................................................................... 99 Dtail des entres dans nos dictionnaires de rfrence................................................................... 100

4.
4.1 4.2

Un exemple flagrant de dissymtrie : les traductions du verbe aborder en italien .......... 107
Prparation franaise du verbe, pour aborder aborder ................................................................... 107 Traductions..................................................................................................................................... 112

5.
5.1 5.2 5.3

De la polysmie faible lexplosion combinatoire : le verbe abandonner....................... 120


Polysmie faible ............................................................................................................................. 120 Un champ lexical large................................................................................................................... 121 Les traductions dabandonner......................................................................................................... 123

6.

Lintgration des locutions et priphrases verbales dans le champ de ltude ................. 127

6.1 Intgration des priphrases verbales dans les champs lexicaux : exemple partir de se mettre en franais. ........................................................................................................................................................ 127 6.2 Travail prliminaire sur se mettre ................................................................................................ 129 4

6.3 6.4

Intgration par technique de balayage ...................................................................................... 132 Bilan de lintgration des priphrases ltude, et des lexies aux champs lexicaux de faon gnrale ........................................................................................................................................................ 133

7.

Prolongement des LI......................................................................................................... 134

7.1 La traduction intermdiaire : Paraphrase ou pas paraphrase ?........................................................ 134 7.2 Reprsentation des lexiques multilingues issus du LI. Projet de superposition de champs smantiques en plusieurs langues. .................................................................................................................. 135

8.
8.1 8.2

Transition avant tude sur corpus..................................................................................... 140


Le statut des traductions dans le miroir .......................................................................................... 140 Les limites de lobservation des dictionnaires................................................................................ 141

9.

Les verbes de parole en contexte................................................................................ 143

9.1 Quelques mots sur la linguistique de corpus .................................................................................. 143 9.2 Traitement des verbes de parole ..................................................................................................... 148 CHAPITRE III .................................................................................................................................................... 161 tude autour du verbe traverser. Complments et complmentarit des donnes contextuelles et lexicographiques. ................................................................................................................................................ 161

1.
1.1 1.2 1.3

La version lexicographique de traverser .......................................................................... 162


Des acceptions de traverser............................................................................................................ 162 Des traductions de traverser........................................................................................................... 165 Comparaison LI / LD en anglais..................................................................................................... 166

2. 3.
3.1 3.2

Vers une analyse plus approfondie de traverser en contexte ........................................... 169 Pourquoi complter les donnes par le corpus ................................................................. 172
Une question qui divise ou qui anime la communaut ................................................................... 172 Le plus beau corpus du monde ne peut donner que ce quil a ........................................................ 173

4.

Traverser dans le corpus................................................................................................... 174

4.1 Introduction la traverse .............................................................................................................. 174 4.2 Diagrammes ontologiques des traverses partir de la base littraire ........................................... 176 4.3 Mouvement et bornage dans les traverses .................................................................................... 184 4.4 Modlisation................................................................................................................................... 199 4.5 Analyse contrastive ........................................................................................................................ 211 4.6 Conclusion de la traverse.............................................................................................................. 223 CHAPITRE IV.................................................................................................................................................... 228 Modlisation et algorithme de construction du graphe des Champs Smantiques Multilingues Unifis ou CSMU ............................................................................................................................................................................ 228

1.
1.1 1.2 1.3 1.4

Objectifs de la modlisation et Exploitation des donnes ................................................ 229


Problmatique originelle ................................................................................................................ 229 Problmatique enrichie................................................................................................................... 230 Mthodologie et Travaux Prliminaires ......................................................................................... 231 Construction des bases de donnes................................................................................................. 238

2.
2.1 2.2

Sur la notion de synonymie .............................................................................................. 240


Prliminaires................................................................................................................................... 240 Les niveaux de synonymie ............................................................................................................. 241

3.
3.1 3.2 3.3 3.4 3.5 3.6 3.7

Recensement des variables et lecture du tableau.............................................................. 246


tiquettes de mot ............................................................................................................................ 246 Liens de synonymie........................................................................................................................ 246 Synonymes et quasi-synonymes..................................................................................................... 247 Collocations sujet ........................................................................................................................... 247 Collocations objet........................................................................................................................... 248 Constructions syntaxiques indirectes.............................................................................................. 249 Indices non langagiers .................................................................................................................... 250

4.
4.1 4.2

Unification des contextes ................................................................................................. 250


Pourquoi unifier.............................................................................................................................. 250 Comment unifier............................................................................................................................. 251

5.

criture de l'algorithme .................................................................................................... 252


5

Choix de la procdure de mise en uvre........................................................................................ 252 5.1 5.2 Lalgorithme................................................................................................................................... 272 5.3 Atouts et perspectives..................................................................................................................... 290 Conclusion .......................................................................................................................................................... 292 Bilan final, Perspectives et Obstacles ................................................................................................................. 292

1. 2. 3. 4.

Rappel des objectifs et des rsultats ................................................................................. 293 Contribution pour le dictionnaire du XXIme sicle........................................................ 294 Des difficults en grand nombre....................................................................................... 297 Conclusion finale.............................................................................................................. 299

Glossaire ............................................................................................................................................................. 300 Bibliographie....................................................................................................................................................... 301

Articles et Ouvrages .......................................................................................................................... 301 Dictionnaires ................................................................................................................................. 315 Quelques Pages Internet ............................................................................................................. 316

TABLE DES FIGURES


Figure 1 : Graphe de Prix Goncourt par John Sowa (1992) ............................................................................ 70 Figure 2 : Chemin dit dactivation .................................................................................................................. 80 Figure 3 : Graphique rcapitulatif, seconde version. Mise en exergue de la dissymtrie.................................... 115 Figure 4 : Tableau rcapitulatif du verbe aborder ............................................................................................... 116 Figure 5 : Tableau des correspondants anglais du verbe ABANDONNER : premire reprsentation du lexique invers franais-anglais....................................................................................................................................... 125 Figure 6 : Fragment du tableau de donnes autour de aborder ........................................................................... 137 Figure 7 : Fragment du tableau de donnes autour de abandonner..................................................................... 138 Figure 8 : Fragment du tableau de donnes autour de se mettre () .................................................................... 139 Figure 9 : Fragment de CSMU pour les verbes de parole partir de donnes attestes...................................... 159 Figure 10 : tableau de correspondance des traductions anglaises de traverser ................................................... 167 Figure 11 : Fragment du tableau de donnes autour de traverser ....................................................................... 168 Figure 12 : traverse dans la largeur ................................................................................................................... 177 Figure 13 : traverse dans la longueur ................................................................................................................ 178 Figure 14 : traverse angulaire............................................................................................................................ 179 Figure 15 : transperce dynamique ..................................................................................................................... 179 Figure 16 : traverse de lextrieur vers lintrieur............................................................................................. 180 Figure 17 : traverse de lintrieur vers lextrieur............................................................................................. 180 Figure 18 : traverse de lintrieur vers lintrieur avec objectif ........................................................................ 181 Figure 19 : traverse en intrieur sans objectif.................................................................................................... 181 Figure 20 : transperce statique........................................................................................................................... 182 Figure 21 : traverse statique en largeur ............................................................................................................. 183 Figure 22 : traverse semi-dynamique ................................................................................................................ 183 Figure 23 : typologie aspectuelle ........................................................................................................................ 192 Figure 24 : Modle 1 pour traverser.................................................................................................................... 202 Figure 25 : Modle 2 pour traverser.................................................................................................................... 203 Figure 26 : Modle 3 pour traverser.................................................................................................................... 205 Figure 27 : Modle 4 pour traverser.................................................................................................................... 207 Figure 28 : Modle 5 pour traverser.................................................................................................................... 208 Figure 29 : Modle 5bis pour traverser ............................................................................................................... 209 Figure 30 : Fragment de CSMU pour traverser en contexte............................................................................... 225 Figure 31 : mise en forme du fragment d'entre "to leave" ................................................................................. 236 Figure 32 : seconde mise en forme dun fragment d'entre de to leave .............................................................. 253 Figure 33 : fragment slectionn de parler ......................................................................................................... 253 Figure 34 : Ligne slectionne de to leave .......................................................................................................... 259 Figure 35 : Fragment slectionn de to leave ...................................................................................................... 266 Figure 36 : Typologie des constructions syntaxiques associes au verbe ........................................................... 268

INTRODUCTION

1. Prsentation du sujet : origine, problmatique gnrale et objectifs


Lobjectif de recherche que nous nous sommes fix est le suivant : partir de lanalyse de la polysmie des verbes dans un cadre lexicographique et sur la base des lexiques miroirs dont nous expliquerons prcisment le principe, nous avons cherch tablir une mthodologie de rcupration de lintgralit des donnes de dictionnaires bilingues pour les inclure dans des modles des fins dexploitation informatique. En constatant certaines lacunes naturelles des dictionnaires, et ainsi en admettant que ces derniers ne reprsentent pas la langue dans son intgralit, le cadre de recherche sest naturellement largi vers des analyses linguistiques sur corpus, en loccurrence sur la base littraire FRANTEXT, dans lunique but de montrer que les faits de langue observs dans la littrature sont complmentaires des donnes des dictionnaires et quils peuvent tre modliss dans le mme espace que ces dernires. Nous avons travaill sur trois dictionnaires bilingues, franais-anglais, franais-espagnol et franais-italien et la catgorie verbale a t le matriau central de notre travail. Il faut galement noter que toutes nos tudes sont centres sur le franais et sont destines linformatisation, conformment la politique scientifique de lATILF qui est un laboratoire danalyse et de traitement informatique de la langue franaise. Pour mener bien cet objectif assez vaste, nous avons procd en trois tapes, lesquelles correspondent au plan gnral de la thse : Tout dabord, nous discutons de la polysmie dans un cadre lexicographique et nous essaierons de montrer quelles sont les ressources relles des dictionnaires bilingues ainsi que leurs principales lacunes, pour la plupart invitables. Dans un deuxime temps, nous prsenterons des travaux sur donnes littraires destins pallier quelques-unes de ces lacunes invitables des dictionnaires pour montrer que les dictionnaires et les corpus peuvent tre complmentaires dans certaines circonstances. Et enfin, nous prsenterons les modles que nous avons conus partir de nos prcdentes analyses ainsi que lalgorithme de programmation qui permet de transformer ces modles en graphes lexicaux exploitables informatiquement. Le premier travail que nous avons effectu a t de faire une analyse critique et descriptive des dictionnaires bilingues, de leur contenu, de leurs structures et surtout de ce quils reclent rellement en termes de liens et dinformations cachs. titre dexemple, dans un seul extrait de lentre to leave tir du Robert & Collins franaisanglais dernire dition, il y a 28 types dinformations diffrents que nous avons relevs et dcrits dans cette thse, ce qui est beaucoup :
leave /li:v/ (vb : prt, ptp left) VT a (= go away from) [+ town] quitter, partir de ; (permanently) quitter ; [+ room, building] sortir de, quitter ; [+ person, job, ones husband, wife] quitter ; [+ ones children] aban9

donner he left Paris in 2001 il a quitt Paris en 2001 we left Paris at 6 oclock nous sommes partis de Paris or nous avons quitt Paris 6 heures () e (Math) three from six ~s three six moins trois galent trois f (in will) [+ money] laisser {to } ; [+ object, property] laisser, lguer {to } VI (= go away) [person, train, ship etc] partir, sen aller ; (= resign) partir, dmissionner to ~ for Paris [person, train] partir pour Paris ; [ship] partir or appareiller pour Paris leave off VI (*= stop) sarrter where did we ~ off? (in work, reading) o nous sommesnous arrts? ~ off ! arrte !, a suffit ! * VT SEP a (*= stop) arrter (doing sth de faire qch) leave out VT SEP a (= omit) (accidentally) oublier, omettre ; (deliberately) exclure ; [+ line in text] (also Mus) [+ note] sauter

La lecture dun tel dictionnaire ressemble presque un exercice de spcialistes dautant quil faut se familiariser avec les typographies diffrentes choisies pour caractriser chacun des types. Ce qui nous intresse prioritairement dans cet extrait et dans le reste du dictionnaire cest : quelles sont les informations ncessaires pour caractriser un lien de traduction et comment les modliser. Lautre grand intrt de cet extrait est quil nous apprend beaucoup de choses en plus de nous donner les traductions de to leave. Si nous observons nouveau le dbut de lextrait, aprs les informations phontiques et grammaticales, on observe que quitter et partir de sont assimilables des synonymes lun de lautre lorsquils traduisent to leave avec comme objet direct ville. De mme to go away from est prsent comme un synonyme de to leave dans les mmes conditions demploi et par voie de consquence comme une traduction potentielle de quitter et partir de et pouvant tre traduit par eux. Ainsi, cette simple relation de traduction cre deux liens de synonymie et deux liens de traduction qui sont des informations que nous avons appeles caches ou indirectes dans notre document, mais ce ne sont pas les seules. la lecture de ce fragment, il est permis de penser que la prsence de ces donnes caches est un phnomne gnralis et quun simple dictionnaire bilingue contient galement et dans une certaine mesure deux dictionnaires de synonymes monolingues. En tout tat de cause, il faut que ces liens apparaissent clairement dans notre modlisation. Mais la richesse cache des dictionnaires ne sarrte pas l et nous allons maintenant exposer brivement le principe des lexiques miroirs qui est une manire de
10

rconcilier les deux parties dun mme dictionnaire bilingue car leur confrontation montre dans les faits que ce sont vraiment deux dictionnaires trs diffrents. Pour bien illustrer le fonctionnement des lexiques miroirs ou inverss, nous utiliserons nouveau lentre du verbe to leave. Ce que nous appelons le lexique droit (le LD) de to leave est lensemble des traductions franaises de to leave lentre de celui-ci dans la partie anglais-franais du dictionnaire et qui contient donc entre autres quitter et partir de. Maintenant, ce que nous appelons le lexique miroir ou invers (le LI) de to leave correspond lensemble des verbes franais pour lesquels to leave est une des traductions potentielles dans la partie franais-anglais du dictionnaire. En tant quutilisateur moyen, nous nous attendions lors de la confrontation des lexiques droit et invers observer une certaine symtrie entre les deux. Or, nous avons constat que les cas de symtrie pour les traductions entre lexmes ne reprsentent que de 20 50 % du total. En dautres termes, lorsquun verbe est propos comme traduction dun autre dans une partie dun dictionnaire bilingue, il y a moins dune chance sur deux que la rciproque soit vraie dans lautre partie du dictionnaire. Pour effectuer cette comparaison, nous avons construit trois lexiques miroirs complets entre le franais et lespagnol, le franais et langlais et le franais et litalien, ce qui reprsente 9000 formes verbales du franais et leurs correspondants inverss dans les trois autres langues. Cette dissymtrie est encore plus flagrante si lon essaie de rattacher les justes acceptions du verbe tudi ses traductions. Nous avons fait ce travail partir de quelques verbes franais, dont traverser qui bnficiera dun traitement tout particulier. Tout dabord nous avons extrait du dictionnaire Le Petit Robert toutes les acceptions de traverser et nous les avons numrotes. Ensuite, nous avons fait le relev des verbes anglais qui entretiennent un lien de traduction avec lui et nous avons associ chaque lien lindice correspondant. La deuxime colonne du tableau que lon peut observer la page 167 correspond au lexique droit de traverser et il contient le relev des indices se rapportant aux acceptions de traverser si le verbe anglais de la premire colonne est propos comme traduction de traverser. linverse, la troisime colonne qui correspond au lexique miroir de traverser contient ces indices lorsque cest traverser qui est la traduction du verbe anglais. On peut observer dans ces conditions danalyse quil y a un seul cas de symtrie dans ce relev, celui de la correspondance entre traverser et to occur to ce qui reprsente ici un cas sur quarantedeux. Ltude statistique globale na que peu dintrt, ce que nous retenons est surtout cette trs grande asymtrie lintrieur dun mme dictionnaire. Mme si nous admettons que la symtrie ne peut tre la rgle, il sagit tout de mme dun phnomne dune ampleur trs inattendue. Une fois encore il faudra en rendre compte dans les modles. Ces deux constats ont eu deux consquences directes sur notre recherche, lune entranant lautre : tout dabord, la multiplicit des liens rellement prsents dans le dictionnaire ainsi que la difficult de dcrire lasymtrie au cas par cas par les acceptions font quil est quasiment impossible de continuer avoir une approche smasiologique du problme, cest--dire de continuer travailler partir des lexmes
11

polysmiques et de leurs dgroupements en acceptions. Il a donc fallu rechercher une dmarche plus onomasiologique, cest--dire qui traite dabord de la signification pour remonter vers le mot. Cest pourquoi nous avons introduit dans le sujet la notion de lexie au sens que Pottier puis Meluk et son quipe lui ont donn, savoir un mot pris dans une acception bien spcifique. Dans le cadre de notre propre modlisation, une lexie est un mot muni dun faisceau de traits qui la distinguent de toutes les autres lexies du mme mot. Voyons toujours notre exemple de to leave, ces traits peuvent tre une traduction, un ou plusieurs synonymes lis la traduction, ventuellement des restrictions sur le choix des collocations sujet et objet, sur les constructions syntaxiques voire sur le registre, le domaine demploi et sur certaines informations extra-langagires. Bref une lexie dans nos modles est caractrise par tout ce qui est jug pertinent pour caractriser une relation de traduction dans un dictionnaire bilingue. Nanmoins, un certain nombre de contraintes pour la plupart lies au format de ldition empchent les ouvrages lexicographiques doffrir une visibilit entirement satisfaisante des phnomnes linguistiques qui prexistent leur cration. Il est galement vident quun dictionnaire grand public se doit de reflter la langue acadmique, et accessoirement les faits de langue qui sont prsents dans les dictionnaires monolingues du mme diteur. Il est peu probable quun dictionnaire srieux se permette de rpertorier minutieusement les crations des auteurs littraires en les prsentant comme des faits de langue tablis, notamment pour des ouvrages qui sont destins des locuteurs non natifs. Cest pourquoi nous avons t amen poursuivre nos rflexions par des analyses linguistiques dbarrasses des contraintes lies au cadre lexicographique, en nous fondant exclusivement sur des donnes attestes extraites de la base littraire FRANTEXT. En particulier, nous avons relev deux phnomnes linguistiques que les dictionnaires bilingues ne peuvent pas traiter de par leur nature et cest ce que nous essaierons dexpliciter dans la partie de ce document qui suit lanalyse critique des dictionnaires. Tout dabord, il est trs difficile de slectionner des traductions concurrentes pour une mme acception en fonction de la nature smantique des arguments du verbe, voire en fonction du co-texte un peu plus loign, ce dernier tant moins dpendant du verbe mais participant galement sa caractrisation smantique et aspectuelle. Mme dans le dictionnaire grand public le plus labor (comme le Robert & Collins), le problme demeure car louvrage ne propose que le choix dun objet ou dune classe dobjets sans entrer plus en dtails dans sa nature smantique. De plus, le dictionnaire ne propose jamais plus dune information collocationnelle la fois : si lobjet est prcis, le sujet ne lest pas, et inversement. Cest pourquoi nous avons dcid de nous pencher sur le verbe traverser et son co-texte, dans le cadre dun travail collaboratif au sein de lATILF. Le verbe traverser est fortement dpendant de son environnement co-textuel quant sa caractrisation aspectuelle, ce qui le rend difficile traduire si ce co-texte
12

nest pas prcisment tudi. Dans les tudes gnrales sur ce verbe comme celles de Muller & Sarda, Victorri ou celle de Vendler pour son quivalent anglais to cross, traverser est systmatiquement trait comme un verbe dit daccomplissement, cest-dire dont lemploi suppose que le sujet qui traverse passe dun ct lautre de lobjet travers, les bornes spatiales de celui-ci tant supposes dpasses lissue de la traverse. On retrouve cette vision prototypique dans les dictionnaires puisque le Petit Robert donne les dfinitions du verbe en respectant la lettre ce trait aspectuel daccomplissement, de mme que les dictionnaires bilingues. Or, un premier passage en revue du corpus littraire montre que traverser peut prendre dautres valeurs aspectuelles selon ses emplois et que ces valeurs aspectuelles sont calculables partir de plusieurs facteurs : le sens du verbe lui-mme, le co-texte extra-prdicatif qui fixe les bornes de laction (hors ou lintrieur de lobjet travers), la nature spatiale des arguments du verbe et en dernier lieu la vision subjective du locuteur, ou plus prcisment la manire dont le locuteur peroit lobjet travers. En combinant tous ces facteurs nous sommes parvenus une modlisation des occurrences de traverser qui les fait tous apparatre dans des graphiques mathmatiques pourvus dun axe spatial et dun axe temporel. En transposant les occurrences de traverser dans ces modles, nous avons pu prouver que le verbe rentre potentiellement dans les quatre catgories aspectuelles majeures de Vendler (accomplissement, achvement, activit et tat). La prise en compte de ces facteurs peut avoir une incidence sur le choix de la meilleure traduction pour une occurrence donne. Sans entrer dans le dtail de notre analyse contrastive, nous citerons sans le dtailler un exemple, construit celui-l, qui illustre ce que nous venons de dire : Jean a travers la fort dont la traduction gnrique peut tre John crossed the
forest.

Traverser peut ici tre traduit en anglais par des prdicats contenant chacune des trois prpositions habituelles pour le traduire (across, through et over). Trois interprtations sont possibles, chacune de ses interprtations tant soumise aux facteurs dont nous faisons la liste plus haut. Le choix de la bonne traduction pour cette phrase dpend directement de leur prise en compte minutieuse. Lorsque le co-texte et certains lments lis laspect et au contenu smantique des arguments sont pertinents et aisment reprables, nous pouvons en effectuer la saisie dans la base de donnes. Nous reviendrons sur celle-ci au moment de parler de la modlisation. La deuxime chose que les dictionnaires ne peuvent pas faire, et pour cause, cest montrer ce quils ne montrent pas. En effet, nous lavons dj dit, les dictionnaires destins au grand public sont avant tout des ouvrages acadmiques qui se doivent de reprsenter la langue telle quelle est normativement tablie un moment du temps. Ceci exclut de pouvoir y trouver des sens de mots originaux ou des constructions syntaxiques qui nauraient pas t valides par les lexicographes comme faisant partie intgrante de la langue. Or, lobservation des uvres littraires fait clairement apparatre que les sens et constructions inhabituels ou inattendus
13

sont loin dtre des phnomnes rsiduels et quils ne sont pas non plus toujours rcents ni isols. ce sujet, les auteurs littraires font la preuve que la langue nest pas seulement un systme fig mais surtout un socle normatif partir duquel de nombreuses fantaisies dexpression sont possibles. Lmergence de sens nouveaux pour les verbes eux-mmes est parfois, il est vrai, difficile dcrire. En revanche, il est plus ais de rpertorier les constructions syntaxiques nouvelles (surtout si elles se rptent dans des uvres littraires diffrentes) de mme que quelque originalit dans la nature smantique des arguments du verbe. Les verbes qui font partie du vaste paradigme des verbes de parole1 sont particulirement mallables de ce point de vue et cest ce qui nous a conduit en proposer ltude partir de FRANTEXT dans le but avou denrichir les bases de donnes dorigine lexicographique sans en modifier la structure. Notre travail sur ces verbes a t effectu dans le cadre du PDR ILF transitivit . partir dobservations sur lopposition entre verbes de parole transitifs et intransitifs, nous avons formul lhypothse que la plupart des verbes classs intransitifs devaient pouvoir tre employs dans des formes transitives avec une certaine frquence. Pour effectuer une analyse complte des occurrences des verbes de parole, nous avons labor une grille danalyse syntaxique et smantique qui puisse les dcrire toutes. Le codage de 2300 occurrences littraires dans ces grilles a montr que notre hypothse de dpart tait justifie pour un grand nombre de verbes alors mme que les dictionnaires ne le montrent pas, ou trs peu et trs lentement. titre dexemple, nous citerons le cas du verbe aboyer qui nest rpertori comme verbe de parole dans le Robert & Collins que sous la forme verbe intransitif quivalent de crier. Dans les textes de Frantext postrieurs 1960, les formes transitives daboyer en tant que verbe de parole sont trs nettement majoritaires et se rencontrent avec les constructions syntaxiques les plus varies. Bien sr, on peut toujours objecter que ces formes sont accidentelles et ne refltent que la propension des locuteurs dune langue en faonner le matriau pour des raisons stylistiques ou de mconnaissance de la langue. Cependant, ce serait nier lampleur du phnomne et cest ce qui nous a conduit intgrer ces faits de langue dans nos modles. Le fait quaucune traduction ne soit propose initialement pour ces occurrences daboyer nest en soi pas problmatique pour notre travail densemble. En effet, nos bases de donnes sont conues pour contenir des lexies, cest--dire des emplois bien particuliers dun mot mais elles nimpliquent pas que ces lexies sont ncessairement associes pralablement une traduction. En loccurrence, les lexies qui seront saisies pour aboyer auront comme traits renseigns les collocations sujet et objet, la construction syntaxique du mot source et ventuellement une information complmentaire permettant de voir que lon a affaire lemploi mtaphorique du verbe dorigine. La finalit de ces travaux sur corpus est dobserver la ralit du langage sans contraintes a priori afin de ramener la description de celui-ci aux intentions relles
1

En prenant toutes les prcautions qui simposent pour dsigner cet ensemble de verbes atypique et trs htrogne. Voir la fin du chapitre II.
14

des auteurs ou tout le moins sen rapprocher le plus possible. Nous esprons montrer partir de ces analyses comment lobservation de donnes attestes peut complter ou enrichir nos modles sans en bouleverser la structure dans le but de runir des informations lexicales de sources diffrentes dans une mme base dinformations qui est finalement une banque de donnes. Le dernier volet de notre travail concerne la modlisation proprement dite des lexies repres dans les dictionnaires et dans les corpus littraires. La premire tape de la modlisation est la transformation en bases de donnes des dictionnaires bilingues. Nous laisserons de ct pour linstant les occurrences littraires car la saisie des lexies quelles induisent nest probablement pas automatisable. Revenons notre fragment dextrait de to leave. Comme nous lavons dit, ce fragment contient outre un lien de traduction plusieurs liens de synonymie et de traduction prsume quil va falloir ordonner. Pour en rendre compte, nous avons effectu une nomenclature de liens de synonymie, lesquels se retrouvent dans lalgorithme final. Trois de ces liens sont directs (traduction directe, synonymie monolingue et traduction rciproque), trois autres sont indirects (synonymie partielle en langue source, partielle en langue cible et traduction indirecte). Tout le travail de modlisation dune lexie rside dans le codage de toutes les informations linguistiques prsentes dans la ligne. En loccurrence, notre fragment induit la dfinition de plusieurs liens et structures pour les lexies prsentes : Deux liens de synonymie de traduction directe (ST) entre to leave et laisser et entre to leave et partir de Un lien de synonymie partielle en langue source (SPS) entre to leave et to go away from Un lien de synonymie partielle en langue cible (SPTC) entre laisser et partir de Deux liens de synonymie indirecte (SI) entre to go away from et laisser et entre to go away from et partir de. Une structure de traits pour chacune des quatre lexies to leave, to go away from, quitter et partir de dont la plus complte est celle de la lexie source to leave qui contient : Son lemme : to leave Sa langue: Anglais Sa catgorie grammaticale: Verbe Ces trois critres sont communs toutes les lexies du mme mot to leave. Elle contient galement la collocation sujet (pas renseigne donc valeur par dfaut qui est thoriquement sans importance dun point de vue smantique ), la collocation objet (ici house), la construction syntaxique (pas renseigne donc transitif direct), le registre (pas renseign donc neutre ) et les informations complmentaires (absentes).
15

Trois autres structures sont cres pour les trois autres lexies selon un procd un peu diffrent car les informations qui les concernent ne sont pas forcment au mme endroit dans la base.

Et bien entendu, pour permettre lexploitation informatique de tous les objets qui viennent dtre dcrits, les liens et les structures sont munis automatiquement dindices numriques permettant de les runir ultrieurement par lintermdiaire du programme de cration de graphes. Voil par lexemple ce que lalgorithme que nous avons conu fait sur lensemble de notre base de donnes lexicales en la traitant ligne par ligne. Pour justifier lexistence de plusieurs sources de donnes distinctes, et notamment la source des corpus, lalgorithme prvoit que lorsque les cases mot-source ou synonymes ne sont pas renseignes, il ne cre quune structure pour la lexie sans lien de synonymie. Lalgorithme de cration de graphes multilexical , car nous nosons dire pleinement multilingue, a t programm tel quel quelques semaines avant la fin de la thse. Nous navons videmment pas eu le temps de tester ses potentialits mais nous savons dj que la transformation des bases de donnes en graphes est acquise. Dautre part, la perspective de disposer de dictionnaires lectroniques correctement baliss nous autorise esprer lautomatisation complte de toute la chane de transformation du dictionnaire en base de donnes puis de la base de donnes en graphe. La conservation de ltape intermdiaire Base de Donnes nous semble trs importante car cest le seul espace commun la fois aux donnes qui sont automatisables et celles qui ne le sont pas (notamment les donnes littraires originales). La runion des deux types de donnes constitue une bibliothque ou banque lexicale de grande ampleur, ouvrant des perspectives particulirement riches. Pour en finit avec la problmatique gnrale, nous souhaitons dire quelques mots sur les potentialits du travail dinformatisation ralis lissue de notre recherche. Tout dabord, si notre algorithme est capable de transformer un dictionnaire en graphe, linverse est galement vrai moyennant quelques amnagements mineurs. De ce point de vue, on peut dire que notre mthode permettra la gnration automatique de dictionnaires selon un paramtrage trs souple. Par exemple, admettons que nous avons saisi lintgralit de notre dictionnaire bilingue et que nous voulons le restituer sous une forme parfaitement symtrique. Deux lignes de code informatique suffisent pour demander ce que tous les liens de synonymie de traduction soient symtriss et le dictionnaire bilingue symtrique est prt tre gnr. Les applications les plus ambitieuses que nous envisageons sont de deux types : nous esprons dabord pouvoir intgrer dans les bases de donnes des informations issues de dictionnaires monolingues. Enfin, nous esprons pouvoir gnrer, au moins partiellement, des dictionnaires indits partir de ceux qui auront dj t transforms. Par exemple, admettons encore que nous avons saisi un dictionnaire franais-anglais et un dictionnaire franais-syldave. partir de cela, nous souhaitons rflchir aux
16

moyens informatiques mettre en uvre pour gnrer un dictionnaire anglais-syldave compltement indit parce que jamais personne na entrepris de rdiger un tel dictionnaire. Enfin, nous terminerons cette prsentation en citant deux obstacles majeurs : Le premier est que nous navons travaill que sur des langues relativement proches, facilitant leur mise en rapport dans des champs lexicaux communs. En revanche, nous navons pas du tout rflchi la comparaison entre le franais et des langues au fonctionnement trs diffrent, notamment au niveau des verbes. Le deuxime problme est que nous navons travaill que sur la catgorie verbale et ses satellites. ce stade nous ignorons totalement ce que cela induirait en termes de profondes modifications dans la structure de la base de donnes que dy inclure des lexies dautres catgories grammaticales. En premier lieu et avant les descriptions sus-mentionnes, ltude est cense respecter : Le principe dexhaustivit Ce principe est double, il touche tout autant le traitement lexicographique du lexme dans sa langue que son paradigme dquivalents en langue cible. Par ce principe, nous imposons dabord la prise en compte de toutes les entres lexicales dune unit verbale quelles soient rpertories ou non dans les dictionnaires monolingues. Dautre part, une traduction prsente dans le dictionnaire est une traduction prendre en compte, quelle que soit la manire dont elle apparat. La rcupration dune nouvelle entre lexicale est une opration dlicate car larbitraire du lecteur est ici mis en jeu. Par ce principe, nous proposons de ne pas borner le dgroupement de sens celui que prsenterait un dictionnaire monolingue, mais au contraire de louvrir si besoin est en fonction de sens nouveaux qui mergent du fait de lvolution de la langue et/ou de ce que proposent les dictionnaires bilingues et les corpus littraires. Le principe de limpidit Nous entendons par limpidit le principe qui stipule que la lecture et la justification de chaque entre lexicale doivent tre dcodables sans effort particulier. En dautres termes, le locuteur non natif dune des deux langues confrontes nest pas cens hsiter sur lacception laquelle renvoie le mot quil ne connat pas. Pour ce faire, un lexique limpide doit faire apparatre autant dinformations linguistiques quil est ncessaire, en mettant de ct les donnes non pertinentes ou surnumraires, lesquelles brouillent la perception de lutilisateur.

17

Le principe de rcriture Ce principe est la base de tout travail lexicographique selon Dubois & Dubois (1971:84) : il sagit tout simplement de la rgle de la paraphrase. En lexicographie bilingue, il conditionne le transfert dune unit lexicale polysmique vers une vedette donne par une paraphrase en langue-source. Le travail de paraphrase nest pas ncessaire dans la perspective dune implantation informatique de nos lexiques puisque les diffrences au sein de ceux-ci se font par les informations linguistiques extra-lexicales. La rcriture voire la reformulation mentale demeure malgr tout un exercice obligatoire pour dcoder une unit polysmique. Les principes de sous-catgorisation syntaxique et smantique Une entre lexicale pourra tre divise en sous-entres lexicales en fonction des contraintes de slection des arguments et des constructions particulires. Les disparits potentielles dans les collocations sujet et complment ainsi que des diffrences de la structure syntaxique du syntagme verbal (SV) entranent parfois un dgroupement trs fin des verbes qui en sont pourvus. Nous appellerons ce principe le principe de souscatgorisation (cf. les collocations du verbe abandonner comme discriminateurs forts au chapitre II) ; Chaque traduction dun verbe est associe un ou plusieurs types de construction syntaxique qui peut tre la transitivit directe par dfaut. En outre, des collocations gnriques sont souvent proposes lappui de la traduction. Ce sont gnralement ces critres qui permettent au lecteur de dterminer quelle acception du mot vedette correspond(ent) le ou les candidat(s) propos(s). Ces critres accompagnent le principe dexhaustivit en cela quune entre lexicale pourra tre divise en sous-entres lexicales en fonction des contraintes de slection des arguments et des constructions particulires. Le principe de valeur de transfert Lors dune traduction, les facteurs qui entrent en jeu pour le passage dune langue une autre (le transfert ) sont de diffrents types. Outre les contraintes de slection des arguments, cela concerne la hirarchie des traits dfinitoires (registre de langue, idiolecte, genre, paradigme de conjugaison, etc.) et les traits ncessaires pour la traduction (polysmie, sous-catgorisation, traits smantiques intrinsques). Selon le niveau de langue considr, la traduction acquiert ce que nous appelons une certaine valeur de transfert , en complment la paraphrase et aux contraintes de sous-catgorisation dont nous venons de parler. Le principe du miroir en complment ces cinq principes qui sont immdiatement reconnaissables, nous en proposons un nouveau que nous appelons le principe du miroir . Le principe du miroir ramne les informations ignores dune des parties dun dictionnaire bilingue puis les fusionne avec les informations de lautre partie. En
18

procdant de cette faon, nous obtenons un objet lexicographique parfaitement symtrique entre ses deux parties. Dans la plus grande partie du document prsent, cest la transgression systmatique - et involontaire - de ce principe par la lexicographie qui nous concernera. Le principe du miroir est tout simplement le processus de fabrication des LI. Dans tous les cas de polysmie verbale, il sagit dun miroir dformant en raison de la dissymtrie observe. Autre(s) principe(s) suivre Au-del des principes noncs ci-dessus, il ne faut pas oublier le respect de lexistant avant tout : il est important pour nous de ne pas dnaturer ni augmenter ni altrer le matriau lexicographique. En cas derreur manifeste, nous nous autorisons cependant rejeter des traductions mais il sagit de cas trs exceptionnels et concernent essentiellement des coquilles orthographiques ou typographiques. Parmi les sources dinspiration bibliographiques et scientifiques, plusieurs mritent dtre cites ds prsent. Dans une perspective bilingue, le sujet sinspire en partie des travaux de Jacques Franois sur lanalyse comparative des champs smantiques et lexicographie bilingue (in Changement, causation, action, 1989) qui expose le mme type de recherche sur quelques verbes franais et allemands dont il confronte les structures smantiques et aspectuelles sous-jacentes. Quelques pistes de rflexion sont empruntes Igor Meluk, mais avec prudence tant ses modles, particulirement dtaills, paraissent inapplicables des champs entiers forte polysmie. Pour les questions dorganisation du sens et des contextes thmatiques, rfrence est faite, entre autres, Georges Kleiber (1990, 1999), Bernard Victorri et Catherine Fuchs (1996), Gilles Fauconnier (1984), Anna Wierzbicka (1996), Eveline Martin ou encore Hllen & Schulze (1988). Et pour appuyer le travail sur la polysmie verbale, nous utilisons en particulier les travaux de Kleiber (1987) et Maurice Gross (1975) pour le franais, et quelques aspects de la classification verbale de Levin (1993) pour langlais. On trouvera de nombreuses autres pistes de rflexion dans les travaux rcents autour de lunivers des dictionnaires lectroniques : Ceux de lquipe de Jean Vronis sur le recensement des collocations partir dun corpus journalistique, ceux de lquipe de Gaston Gross sur les classes dobjets, ceux de Jacques Franois sur la classification verbale partir de critres aspectuels et participatifs. Ltude de ces travaux rcents est toutefois limite par le caractre fig des diffrents outils proposs. Nous voulons dire par l que les modles construits sont peu volutifs, ou trop opaques selon le cas. Leur exploitation dpasse rarement le cadre de recherche dans lequel ils ont t conus. Dans lensemble, il y a rarement possibilit pour lutilisateur dexploiter les dictionnaires ou lexiques des fins personnelles dimplmentation. En revanche, cet cueil est compens par la relative richesse des exemples proposs ainsi
19

que par une certaine compltude , tant entendu que celle-ci est uniquement le fruit dun dpouillement de corpus restreint (au sens thmatique). En ce qui concerne nos propres donnes, ltude pralable doit permettre de nous diriger vers des tentatives de modlisation de la polysmie verbale. Cette question a t voque entre autres par James Pustejovsky, mais ses modles conduisent selon nous beaucoup plus au traitement de la polymorphie syntaxique qu celui de la polysmie proprement dite (cf. chapitre I sur lauteur et ses travaux). Nous appuyant sur diverses perspectives du domaine (Bouillon & Clas 1993, Hutchins 1986, Dancette 1995), un de nos objectifs majeurs est dapprocher un modle susceptible dintgrer aussi bien la polymorphie2 que les traits smantiques intrinsques ou exprims ainsi que tous les traits pertinents pour la prparation la traduction dune unit verbale. Pour essayer datteindre ces reprsentations multiples, nous puisons largement dans les travaux de Dominique Dutoit sur les rseaux smantiques multidimensionnels universalistes aprioriques (Dutoit, 2000) ainsi que dans lalgorithme de construction des graphes de proximit smantique tabli par Sabine Ploux (1997) et Hyungsuk Ji (Ploux & Ji, 2003) en franais et en anglais, sans oublier les travaux du CRISCO portant galement sur le dictionnaire lectronique des synonymes (Manguin & Franois 2004 en particulier). Dans la partie qui traite des analyses sur FRANTEXT, nous nous appuierons spcialement sur les visions de la linguistique de corpus proposes par Kleiber (1997), Ooi (1998) ou encore Sinclair (1996, cit par Ooi). Dans cet ordre dides, le travail de recherche que nous proposons comporte trois volets qui seront relis par lexploitation de traits et de principes communs : En premier lieu, la prise en compte dun vaste ensemble dentres lexicales et sous-entres lexicales conduit construire une nouvelle faon daborder le lexique multilingue en y intgrant sous forme code toutes les informations pertinentes pour la dtection et la discrimination des sens particuliers dune mme unit verbale. Ce codage devra conduire au regroupement sous forme de champs smantiques des units verbales apparentes et conduira rflchir sur les moyens mettre en uvre pour reprsenter conceptuellement les relations lexicales et smantiques au sein de ces champs dans une perspective de traitement multilingue et non plus seulement bilingue. Le deuxime volet souvre sur une perspective globaliste de la langue, cest-dire qui entend dcrire la langue dans sa ralit au-del de la forme fige que les dictionnaires lui imposent, et inversement. Nos deux travaux de recherche effectus sur le verbe traverser dune part et sur les verbes de parole dautre part sont censs illustrer la complexit du langage rellement produit ainsi que la ncessit douvrir les portes du lexique aux occurrences scripturales originales. Si nous y parvenons, nous

Nous voyons la polymorphie comme une facult pour une mme unit de sens de prendre des formes diffrentes.
20

tenterons de raliser la fusion de toutes les donnes, lexicographiques et littraires, au sein dun espace unique et automatisable. lissue de ce deuxime volet, nous proposons den ouvrir un troisime, si tout va bien : il sera possible dexploiter les rseaux smantiques et conceptuels (cf. Sowa 1983 ; Dutoit 2000 ; Ploux 1997 ; Gaume 2003 ; Manguin & Franois 2004, entre autres) raliss dans loptique dune mise en relation entre les diffrentes langues vises de lorganisation mentale du sens des units verbales. Lobjectif ultime de ce traitement des donnes est dessayer dapporter une solution nouvelle aux systmes de traduction automatique en prenant en compte la fois les exigences dues la richesse de la langue et les impratifs lis limplmentation de ces donnes. Cet apport peut tre double, par les rseaux smantiques et conceptuels dune part et par lmergence de nouvelles rgles bigrammes ou trigrammes3 (voire davantage) dautre part. Lintensit du problme traiter est variable en fonction des langues tudies : ainsi, la relative symtrie entre le franais et litalien semble moins problmatique en cot dinformations que le passage du franais langlais. Lintrt de ltude rside ainsi autant dans la correspondance lexicale entre les langues que dans les mthodes permettant de rduire lcart cognitif qui les spare. Dans le cas le plus favorable, nous souhaiterions laborer des cases conceptuelles o un mme sens sera tiquet dans toutes les langues tudies au mme endroit dans un seul rseau smantique. Cela permettrait en particulier de supprimer certaines tapes intermdiaires de transfert habituellement indispensables en traduction automatique. Par extension, lobjectif ultime de ce travail est daboutir une reprsentation de toutes les langues tudies au sein dun graphe unique de correspondance lexicale, sans intermdiaire entre ces langues.

Nous navons pas effectu lcriture de ces rgles, pas plus que nous navons essay de les intgrer notre algorithme final. Toutefois, certaines de nos analyses, notamment celle du verbe traverser montrent quune large prise en compte du co-texte peut tre trs utile pour la dsambigusation de certains noncs. Cest une des pistes que nous devrons explorer sil y a lieu pour la suite de ce projet.
21

2. Organisation du document 2.1 Des verbes diffrents


Cette thse prsente ltude de plusieurs verbes selon ce que nous cherchons faire merger. La justification dune telle htrognit est double. Tout dabord, chaque verbe ou ensemble de verbes analys(s) met en exergue un ou plusieurs phnomne(s) bien prcis qui ne sont pas ncessairement partags par les autres. En second lieu, les analyses que nous allons dtailler ont toutes un lien avec des recherches cibles (collaborations, congrs, travaux personnels) dans lesquelles nous avons t partie prenante : Le verbe aborder a t le premier tudi, dans deux travaux de matrise, le premier sur la mtaphore des verbes de mouvement, le second pour les travaux fondateurs des Lexiques Miroirs ou Inverss, malgr limpossibilit physique de soutenir ce dernier. Abandonner a t tudi pour son tonnant champ lexical en franais et dans les autres langues en regard de sa polysmie peu marque. Son comportement en traduction a t dtaill pour le congrs international Reprsentation du Sens Montral en juin 2003. Traverser a fait lobjet dune longue et fructueuse collaboration avec Laurent Mascherin (doctorant lATILF travaillant sur laspect et la morphologie du verbe), laquelle a conduit une prsentation au colloque international Space and Time in language and literature Rijeka, Croatie, en avril 2005. Nous nous sommes intresss aux contenus aspectuels des prdications contenant traverser aussi bien qu linfluence du co-texte sur ledit aspect (rfrences tires de FRANTEXT). Se mettre est la seule priphrase verbale dont nous avons pouss ltude sur le mme modle que les verbes monolexicaux. Initialement motiv par une participation au congrs international sur les priphrases verbales Caen (2004), notre travail a permis de dfinir un cadre applicatif et thorique pour faciliter lintgration des priphrases et des locutions verbales nos graphes smantiques. Dire, parler et les autres verbes de parole sont le matriau central des travaux mens par le Projet de Recherche ILF transitivit . Notre implication dans ce PDR a t marque par une redfinition de la notion de verbe de parole, une rcriture de la nomenclature de travail
22

et ltude systmatique du comportement en contexte langagier de tous les verbes de parole ambivalents du franais ( partir de FRANTEXT une fois encore), cest--dire permettant aussi bien des formes transitives quintransitives. Mme si leurs tudes peuvent paratre disparates, chacun de ces verbes a permis la mise en relief dun ou de plusieurs phnomne(s) spcifique(s). Dautre part, la mthodologie dgage pour chacun de ces prdicats verbaux est commune lensemble. En dfinitive, la diversit revendique de nos matriaux danalyse nous a amen penser que seule une analyse verbe par verbe, ou au mieux champ lexical par champ lexical, est valide dans loptique de montrer prcisment le fonctionnement de chacun.

2.2 Plan gnral 2.2.1 Premire partie : problmatique et choix thoriques.


En premire partie, nous prsentons la problmatique, ltat de lart et les choix thoriques associs notre sujet. Le premier thme abord est la polysmie, en tant que thme linguistique trs discut. Quest-ce que la polysmie ? quoi sert la notion ? Nous dbuterons avec une distinction entre polysmie et homonymie avec lide de continuum indterminable (cf. Victorri) et tenterons de nous orienter vers une fusion de la distinction dans le rapport homographique intra-catgoriel4. Diverses questions seront poses lappui de notre dmonstration : La polysmie comme outil danalyse linguistique estelle sans ralit dans la langue ? La polysmie existe-t-elle en tant que telle en dehors dune vision mtalinguistique ? Loin dtre des remises en cause des notions bien tablies dans le domaine de la smantique, nos rponses ces questions correspondent aux objectifs que nous nous sommes fix, savoir la reprsentation des relations smantiques entre les mots de diffrentes langues, relations dbarrasses de toute contrainte ditoriale. Nous aborderons galement, plusieurs formes dorganisation des verbes selon des critres syntaxiques et/ou smantiques (de Maurice Gross pour le franais Jacques Franois (comparaison entre le franais et lallemand et classement des verbes du franais), Levin pour les verbes anglais, les travaux du PDR ILF sur la transitivit des verbes de parole, etc.). Pour complter et tendre notre vision de la polysmie, nous prsenterons la synonymie comme lien smantique majeur dans chaque langue et entre les langues.
4

Une unit lexicale peut appartenir des catgories grammaticales diffrentes, on parlera alors de rapport inter-catgoriel. Dans le cas dune homonymie portant sur une unit de mme catgorie, avec une graphie identique, nous parlons de rapport homographique intra-catgoriel.
23

partir de nos considrations sur la polysmie et la synonymie, nous exploiterons le dictionnaire bilingue comme un facteur de correspondance lexicoconceptuelle complte entre deux langues, en partant du principe quil ny a pas de vide smantique intralangue ni vide smantique interlangue. De cela dcoule lide dunifier les langues de ltude dans un graphe unique (cf. Dutoit pour un dbut de mthodologie). Bien entendu, nous proposons une dfinition la plus prcise possible du verbe, en nous appuyant sur les considrations de Touratier (1996) et des auteurs quil cite pour tayer son point de vue sur la notion. partir de la dfinition choisie, nous dcrirons au passage quelques travaux typologiques lis aux verbes (M. Gross en syntaxe, G. Gross pour le traitement des units polylexicales, Levin pour une classification smantique, Vendler dans une perspective aspectuelle, etc.). En conclusion ce premier chapitre, nous prsenterons la gense et le mode dutilisation des Lexiques Inverss , intgrant les locutions verbales comme units lexico-smantiques homognes car un verbe nest pas un mot au sens strict. Nous utilisons globalement le terme lexie en tant quunit lexicale homogne sur le plan smantique.

2.2.2 Outils et analyse lexicographiques : Lexiques Construction de Champs Lexicaux et Smantiques

Inverss

et

Lobservation critique des dictionnaires bilingues fait apparatre : une forte dissymtrie des deux parties de chaque dictionnaire ; limportance du paradigme de traductions pour chaque lexme courant, ce qui semble induire une forte polysmie sous-jacente (hypothse partiellement corrobore par la consultation de dictionnaires monolingues) ; labsence dorganisation claire des critres de slection du mot-vedette appropri (mme avec un choix de typographies diffrentes pour les diffrencier). Pour pallier le premier problme, nous avons construit des lexiques multilingues partir de tous les verbes du franais (expressions composes comprises) en utilisant la mthode de la fusion des donnes, dune faon similaire Sabine Ploux pour les dictionnaires de synonymes (PLOUX, 1997) : en plus des traductions du verbe recueillies dans la partie franais-langue cible des dictionnaires bilingues, nous avons galement rcupr les verbes en langue cible pour lesquels chaque verbe est une traduction propose. Cest le principe des Lexiques Inverss (LI), selon lexpression que nous avons choisie. La cration des LI permet dans un premier temps
24

de rtablir la cohsion de surface entre les deux parties du dictionnaire pris comme rfrence. Cest galement un pas supplmentaire vers lexhaustivit en traduction potentielle (i.e. dans le choix propos lutilisateur). Afin dassister ce choix et pour rduire les effets de la polysmie absolue, les traductions recenses et fusionnes sont organises dans une base de donnes en fonction de critres discriminatoires pertinents (des constructions syntaxiques jusquaux variations contextuelles) mais initialement exclusivement issues du dictionnaire. Nous obtenons ainsi des micro-paradigmes de traduction pour chaque sens de la lexie ; le regroupement des donnes donnant lieu un dgroupement nouveau des acceptions. Pour rpondre la troisime critique, les critres discriminatoires sont mis en exergue dans la base. Ainsi, ce nest plus le mot-vedette qui est prminent, mais ce qui en motive le choix. Pour effectuer ce dernier, il peut savrer ncessaire de proposer une paraphrase de lemploi du mot-source traduire (ou de sa construction). Do la ncessit dtudier le mot-source conjointement ses synonymes contextuels en langue source. Le travail sur les LI induit quelques questions non subsidiaires quil sagira pour nous de traiter en profondeur : la question de la dissymtrie ou de lasymtrie en lexicographie bilingue : introduction de ce problme rcurrent avec la prsentation dtaille de la dissymtrie lexicographique des traductions du verbe aborder entre le franais et litalien ; la question de la distributionnalit des entres lexicales en fonction des traductions potentielles : avec lanalyse de la distribution interlangue du verbe abandonner. Ses quivalents en anglais, son paradigme de synonymes et quasi-synonymes en franais et leurs traductions. Problmes et solutions ; le traitement des priphrases et des locutions verbales : discussion et travail autour de la priphrase aspectuelle se mettre , mthodologie pour lintgrer nos lexiques en tant quunit verbale part entire. Discussion de son statut la lumire de la dfinition du verbe de Touratier et consorts. Au centre de ce chapitre, nous proposons lexploitation des lexiques inverss pour aboutir aux champs smantiques multilingues unifis qui seront largement dcrits au chapitre IV. Pour une premire exprimentation de ces derniers, nous avons cherch un lexme efficace et facile dutilisation (nombreuses traductions, petit nombre dacceptions). Le verbe abandonner a t retenu pour cette
25

tude en raison de sa faible polysmie et de son noyau de sens stable . Par rcupration des traductions directes, inverses et indirectes, le nombre total de traductions dabandonner est considrable et justifie les moyens mis en uvre pour son analyse et sa reprsentation. Enfin, nous concluerons ce chapitre par un large aperu de nos travaux sur les verbes de parole en contexte langagier et sur linfluence quils ont eu sur notre mthodologie densemble. En effet, le cadre par trop restrictif des dictionnaires noffre pas une vision globale satisfaisante des faits de langue observs dans les corpus. De ce fait et pour largir le champ de notre dmonstration linguistique, nous avons puis dans les travaux effectus en collaboration avec les membres du PDR ILF sur la transitivit la matire ncessaire pour faire une analyse linguistique sur un champ lexical entier. Les verbes de parole ont servi de matire aussi bien au PDR qu nos recherches personnelles ; leur nomenclature est lune des plus riches qui soit en franais puisquon recense prs de neuf-cent verbes ou locutions verbales pour lesquelles au moins une acception respecte explicitement les critres que nous dfinissons prcisment dans ce sous-chapitre pour autoriser leur intgration la nomenclature des verbes de parole. Ltude dans son ensemble pose la question du champ smantique prconstruit et de ses caractristiques affrentes, conduisant souvent une forte remise en cause des donnes langagires issues des dictionnaires et de la grammaire normative pour une classe de verbes relis par un sme commun. Le paradigme des verbes de parole que nous avons rcrit, leur analyse sur corpus et la mise en correspondance interlangue illustrent bien quun dictionnaire ne peut pas donner de vision exhaustive de la langue, et ce quelle que soit sa dvolution.

2.2.3 tude autour du verbe traverser. Complments et complmentarit des donnes contextuelles et lexicographiques.
Le travail effectu partir des seules sources lexicographiques nest pas entirement satisfaisant car il ne rend pas compte du potentiel rel de cration smantique pour chaque unit polysmique. Et par ailleurs le dictionnaire mme fusionn ne fournit toujours pas de manire explicite les informations permettant de distinguer les acceptions en fonction de leurs critres respectifs. Cest pourquoi nous avons effectu des tudes purement linguistiques sur un verbe seul (traverser) afin de confronter les rsultats de lanalyse des donnes issues de corpus aux donnes strictement lexicographiques. Ce chapitre pose une nouvelle fois la question de la compositionnalit smantique pour les donnes lexicales et donne lieu une analyse approfondie des occurrences du verbe traverser en contexte, dans des textes littraires francophones. Traverser est tout dabord considr partir du matriau lexicographique afin de faire ressortir lasymtrie dont il est lobjet dans un seul ouvrage bilingue. Ensuite, partir des occurrences attestes et des conclusions que nous en tirons, nous essayons
26

dtablir des correspondances aspectuelles et lexico-conceptuelles entre traverser et les verbes associs des autres langues que nous confrontons. Pour cela, nous prenons en compte les lments co-textuels qui participent au contenu smantico-aspectuel du verbe, en particulier la configuration spatio-temporelle des arguments de traverser ainsi que les lments extra-prdicatifs dont la porte va jusquau contenu prdicatif. Cette tude dabord trs gnrale conduit considrer les verbe traverser comme un verbe inclassable sur le plan aspectuel si tous ces lments ne sont pas caractriss. Il en rsulte pour nous lcriture de modles quadridimensionnels qui rendent compte dudit aspect, et nous terminons le chapitre sur des considrations constrastives en fonction de tous les critres spatiaux et temporels que nous aurons retenus. Le cas des sens mtaphoriques du verbe sera galement trait, mais surtout pour montrer la difficult quil y a essayer de les classifier et de les reprsenter dans des modles concrets. Suite ces deux analyses distinctes et complmentaires sur traverser et les verbes de parole, deux hypothses seront vrifier : Premire HYPOTHSE : Ces analyses produisent des relations lexicales quivalentes et/ou complmentaires aux dictionnaires. Seconde HYPOTHSE : Ce quon retrouve comme constantes syntaxicosmantiques dans une langue se retrouve dans les autres langues de manire quivalente.

2.2.4 Cinquime Partie : Modlisation et algorithmique des CSMU


Notre objectif final est la constitution de graphes lexicaux multilingues illustrant la non biunivocit des correspondances lexicales entre les langues, et permettant de la dpasser. En effet, nous avons dj insist sur le fait quil est rare qu un terme en langue source corresponde une seule traduction en langue cible. Par surcrot, le dcalage interlangue grandit de manire exponentielle chaque ajout dune langue dans ltude. Le chapitre IV prsente trs en dtail le traitement des critres qui serviront de catgories discriminantes au sein des CSMU. Les Champs Smantiques Multilingues Unifis (CSMU) sont des graphes de relations lexicales lecture multiple, les CSMU pouvant tre visualiss dans leur totalit ou bien partiellement par lappel dune lexie qui y est prsente. Il contient galement lessentiel de notre travail prparatoire la programmation dun graphe de relations lexicales qui soit conforme la mthodologie que nous avons dveloppe auparavant. Selon nos souhaits, la forme de ces champs permettrait de construire des dictionnaires bilingues ou multilingues en utilisant nimporte quelle langue prsente dans le graphe comme langue source, voire en abolissant totalement le statut de langue
27

source. De mme, toute unit lexicale du graphe pourra tre slectionne comme lexie centrale de rfrence pour la visualisation du graphe. Lambition de la mise en algorithme des CSMU peut tre perue comme les moyens mettre en uvre pour oprer la transformation dun ou plusieurs dictionnaire(s) (notamment bilingues) en graphe multilingue unique, lui-mme transformable en dictionnaire(s) son tour. Lajout dune nouvelle langue et de nouvelles donnes ne doit pas en principe dmultiplier le graphe. Lun des objectifs finaux demeure de restituer un dictionnaire de langues coopratif pour laide la traduction partir des CSMU. Pour dcrire prcisment lalgorithme dimplantation du graphe, nous aurons recours aux notions et outils informatiques dobjets structurs, densembles et de fonctions. Les premiers contiennent lensemble des traits distinctifs pour une lexie donne (globalement ou en contexte), les seconds sont utiliss en guise de listes de traits ou de valeurs associes un attribut dobjet donn et les troisimes permettront lcriture de sous-programmes ncessaires la bonne implantation des liens de synonymie que nous dfinissons galement dans ce chapitre. La partie la plus approfondie de ce chapitre prsente lintgralit de lalgorithme final que nous commenterons trs largement en langage naturel. En guise de conclusion intermdiaire, nous tenterons de mettre en avant les atouts dun tel outil sans en ngliger les faiblesses.

2.2.5 Partie conclusive : Bilan et perspectives


En guise de conclusion ouverte nos travaux, cette dernire partie reprend certains points de la problmatique densemble, dont les suivants : la volont de briser le dcalage habituel qui fait reprsenter les systmes lexicaux de chaque langue indpendamment les uns des autres ; la visibilit des champs smantiques multilingues unifis . En quoi ces CSMU peuvent apporter quelque chose dans le domaine du TAL ? Sont-ils seulement utiles dun point de vue thorique ? ; lexploitation des outils informatiques pour la reprsentation et la manipulation de ces champs : opportunit de coupler au langage XML, des logiciels de gestion des bases de donnes ou des graphes visuels (que nous devons justifier hors dun point de vue purement artistique ) ; une contribution au dictionnaire du 21me sicle . Lide est que si un dictionnaire peut gnrer un graphe, alors le mme graphe peut
28

gnrer un dictionnaire. Cette ralit est la meilleure justification de lutilit des Lexiques Miroirs, et savre la mise en relief souhaitable de leur mallabilit ; une rflexion propos de lintrt et ncessit davoir une doublevision du lexique : en aval, il y a la lexicographie, et en amont la reconstitution du lexique par contenu smantique et tude de corpus. Les deux aspects ne sont pas incompatibles. Tout notre travail peut sapparenter un plaidoyer en filigrane pour une linguistique mixte qui postule que les lexies ont une ralit en contexte et une ralit hors contexte et quaucune nest plus valide que lautre pour des raisons que nous justifierons tout au long de ce document ; nous effectuerons galement un petit dtour par les prdicats non verbaux : tout ce qui nest pas verbe nest pas forcment diffrent du verbe dun point de vue smantique, comme nous laurons dj voqu dans la dfinition du verbe dans le premier chapitre. En guise de conclusion finale la conclusion gnrale, nous tenterons une dernire fois de dfendre lintrt rel ou suppos du cheminement de nos travaux jusqu lcriture dun algorithme dont lapport en tant quoutil de recherche doit tre prcis. Le mot de la fin sera pour le plaidoyer pour une linguistique mixte que nous annonons plus haut car la linguistique au sens large ne saurait ignorer aucun pan de la ralit de la langue.

3. Annexes
En raison de leur caractre trs volumineux, nous avons dcid de ne pas faire figurer nos travaux annexes dans le prsent document. Lintgralit des travaux de saisie et de mise en forme des donnes annoncs ci-dessous aura t porte la connaissance des membres du jury et se trouve sur un CD-Rom joint la thse. Lexiques Inverss Lexique Invers Franais-Espagnol en ltat. Grille danalyse de quelques verbes de parole en contexte Cette grille comporte les analyses des occurrences extraites de FRANTEXT dun nombre important de verbes de parole selon le protocole que nous dcrivons succinctement dans le prsent document.

29

Base de donnes de abandonner chantillon des CSMU autour du lexme-noyau abandonner. Saisie intgrale de synonymes et des traductions potentielles de ce verbe pour exprimentation par le programme de cration de graphes. Le graphe qui en dcoule constitue lannexe suivante. Graphe du verbe abandonner Faute de disposer du logiciel adquat, le graphe en question ne se prsente pas sous la forme des graphes que lon a lhabitude de visualiser, avec des tiquettes et des flches, mais simplement sous la forme dun ensemble de liens entre lexies gnrs par un programme de mise en relation des lexies. Malgr les apparences, cela revient exactement au mme. La base de donnes test que nous avons saisie contient 4500 lignes, cest--dire 4500 liens de traduction entre lexies, centres sur le verbe abandonner, ses synonymes franais et ses traductions en anglais dans le Robert & Collins. Si nous observons juste la premire ligne de cette base, nous voyons quelle contient trois units lexicales, le programme va donc gnrer pour cette ligne trois structures de lexies et trois liens de synonymie. Le graphe cr automatiquement partir de cette base de donnes est ici rendu sous une forme lisible par tous. Chaque triplet correspond la cration dun lien de synonymie reliant deux lexies. Par exemple, la premire ligne signifie que la lexie de abandon qui porte lindice 1 possde un lien de synonymie de type traduction directe (ou ST) avec la lexie dabandonner qui possde lindice 2. En remontant au mot, on peut en dduire quabandon et abandonner sont synonymes de type ST via ces lexies. Pour les mmes lexies 1 et 2, on observe que forsake, ou plus exactement la lexie de forsake dindice 3, est cod comme synonyme SPS dabandon et synonyme SI dabandonner comme nous lavons annonc. La base de donnes de 4500 lignes a permis de crer un graphe contenant plus de 12700 lexies et peu prs autant de liens de synonymie. Ce graphe simple est nous lesprons le point de dpart dun travail de recherche trs consquent dans le domaine des dictionnaires et lexiques lectroniques.

30

CHAPITRE I Problmatique et fondements thoriques

31

1. Un sujet vaste
Bien qutant lorigine un travail orient vers la description et lexploitation de donnes lexicographiques, la thse que nous dfendons a largement dpass ces bornes pour aller explorer de nombreux domaines de la linguistique. En premier lieu, lusage systmatique de dictionnaires comme instruments linguistiques de rfrence a conduit une rflexion sur le comportement des units lexicales dcrites ds quelles apparaissent en contexte. ce titre, notre recherche sinterroge longuement sur lenrichissement des donnes par le corpus, et par-dessus tout sur le thme connexe : quelle linguistique mener en smantique lexicale ? Derrire cette vaste question, nous entrebillons la porte vers un dbat central des sciences du langage contemporaines : quelle linguistique sans corpus et quelle linguistique de corpus ? Nous montrerons le plus largement possible quil ny a pas incompatibilit entre la linguistique de corpus et les approches traditionnelles, majoritaires avant ce mouvement denvergure. Dautre part, nous entendons galement dmontrer que le ou les corpus ne peuvent pas rellement nourrir des thories et des applications qui vont au-del de ce quils reprsentent pour eux-mmes, ce qui pour notre chapelle conduit rejeter la corpus-driven linguistics de Sinclair en tant que panace (voir au chapitre II, sous-chapitre 9). Le travail de lexicographie ne seffectue pas au hasard, en fonction du caprice momentan dun rdacteur face un lexme particulier ; il sexerce au contraire dans le strict respect dune mthodologie fonde sur des principes tangibles. Toutefois, lexemple du TLF nous montre que si tout rdacteur isol a des principes gnralement stables, ses collaborateurs ont tendance dvelopper leur propre mthodologie, au risque de mettre en pril la cohsion de lensemble. A partir de nos lectures et de nos rflexions sur le sujet, nous avons dcid de proposer notre propre mthodologie de construction de lexiques. En premier lieu et avant la description des lexiques inverss sus-mentionne, nous rappelons que ltude est cense respecter : le principe dexhaustivit ; le principe de limpidit ; le principe de rcriture ; les principes de sous-catgorisation syntaxique et smantique ; le principe de valeur de transfert ; le principe du miroir .
32

Ces principes ne seront gure redfinis ni rvalus mais serviront de toile de fond permanente lexposition de nos travaux de recherche.

2. Sur les notions de base 2.1 Quest-ce que la polysmie ? 2.1.1 Dfinition gnrale
La premire dfinition connue de la polysmie a t donne par Bral (1897 :154/155) :
Le sens nouveau, quel quil soit, ne met pas fin lancien. Ils existent tous les deux lun ct de lautre. Le mme terme peut semployer tour tour au sens propre ou au sens mtaphorique, au sens restreint ou au sens tendu, au sens abstrait ou au sens concret A mesure quune signification nouvelle est donne au mot, il a lair de se multiplier et de produire des exemplaires nouveaux, semblables de forme, mais diffrents de valeur. Nous appellerons ce phnomne de multiplication la polysmie. Bral (1897 :154/155)

Nous retenons de cette notion alors nouvelle le fait que Bral lassocie un phnomne de multiplication , induisant linterprtation de la polysmie comme phnomne de production autant que comme tat de la langue. Autrement dit, la polysmie peut tre perue comme la capacit des mots de prendre un sens nouveau , ainsi que le notent Victorri et Fuchs (1996 :11) propos de la dfinition du mme auteur. De ce point de vue, il est possible de percevoir la polysmie comme un potentiel de la langue, celui de faire apparatre des significations nouvelles pour des units qui ne les offraient pas prcdemment. De fait, mme si ce potentiel nest pas forcment exploit, tous les mots de la langue seraient donc des units polysmiques en puissance. Ce dernier point est trs important dans la mesure o il sous-tend lextrme instabilit du lexique. Bien que nous nen ayons pas conscience, ce dernier volue et se modifie constamment, rendant superflue toute tentative den figer le contenu. Ce potentiel aura une influence sur les modles que nous allons crer dans la mesure o nous devrons prvoir lopportunit de les faire voluer tout moment. La linguistique et le linguiste tentent de distinguer la polysmie (capacit dun mot prendre plusieurs sens) de lhomonymie (fait pour une unit lexicale de constituer plusieurs mots) en se fondant sur des critres diachroniques : deux units homographes, homophones et de mme catgorie grammaticale sont polysmiques si elles partagent le mme tymon, et homonymiques dans le cas contraire. Selon
33

Victorri & Fuchs (op. cit.), accepter cette dfinition revient ignorer que lvolution de la langue a favoris lloignement des diffrentes acceptions de nombreuses units lexicales tymon unique.
Un exemple bien connu est celui de grve, qui, partir du sens de rivage, a pris progressivement lacception darrt de travail par lintermdiaire du nom de la Place de Grve, lieu o lon transbordait les marchandises circulant sur la Seine Paris, et qui tait devenu le lieu de rassemblement des travailleurs : tre en grve a signifi au 18 sicle chercher du travail, par extension du sens attendre lembauche en place de Grve (). Victorri & Fuchs (1996)

Bien qudifiant, cet exemple ne satisfait pas totalement notre vision de la polysmie pour une raison trs simple : Lapparition de lexpression tre en grve ne rsulte pas dun processus de polysmie tel que Bral le dcrit, savoir quil ne sagit pas ici du potentiel du mot grve dsigner autre chose que le bord de mer par analogie celui-ci. Au contraire, lexpression en question a t construite directement partir dun nom de lieu ponyme5 de grve qui avait dj lui-mme perdu tout lien smantique vident avec son terme dorigine. De ce point de vue, il ny a jamais eu de processus polysmique pour la cration de lexpression tre en grve, mais simplement un processus mtonymique6 de corrlation entre une action et le lieu o elle se produisait habituellement. De mme, nous pensons que lexemple de grve nest pas comparable avec la polysmie de bureau, galement cit par les auteurs, laquelle fut galement gnre par mtonymies successives (bureau = sous-main meuble de travail pice o lon travaille lieu de travail ensemble des personnes travaillant ensemble (dans un bureau ou pas)) o chaque nouveau sens est directement motiv par le prcdent. Si le critre diachronique est insuffisant ou plus assez pertinent pour discriminer les deux notions, il faut par consquent essayer de les caractriser par une opposition smantique en synchronie, ce qui rend dautant plus difficile la distinction entre polysmie et homonymie. Pour dautres auteurs, il y a polysmie lorsquil y a existence de sens diffrents pour un mme mot, mais de sens perus comme relis dune manire ou dune autre. (Cadiot & Habert, 1997:3) Or, il est relativement difficile de dterminer une gradation des degrs de proximit de sens entre deux acceptions dun mme homographe, et bien davantage den systmatiser la mthode pour toutes les units dune langue. Si lon admet la
Cest--dire portant le mme nom quun lment qui lui est reli par mtonymie, en loccurrence la Place de Grve. 6 La mtonymie dcrit un processus de correspondance lexicale entre deux lments relis par une relation de proximit ou de contigut concrte ou abstraite de type personne-lieu o se trouve cette personne , uvre-crateur de luvre , etc.
34
5

dfinition prcdente, il est manifeste que celle-ci soppose une perception diachronique de la langue puisque le hasard de lvolution dune langue peut aussi bien loigner des acceptions tymologiquement corrles7 quen rapprocher dautres entre deux homographes dorigines distinctes. Ce dernier phnomne est un processus dinfluence ou dimprgnation : les sens loigns dun mme terme peuvent se rapprocher par lintermdiaire de leur rattachement une unit de forme quivalente. Ce phnomne est comparable la paronymie, laquelle permet galement lapparition de nouveaux sens pour un terme donn partir dun sens dun mot qui lui est proche phontiquement ou orthographiquement. Plus que tout autre, le phnomne de la polysmie est sensible linstabilit du continuum lexico-smantique dans la langue. Il en est mme le corollaire notionnel.

2.1.2 Des difficults de proposer une dfinition stable


La polysmie est instable en tant que telle. Ainsi que le montrent les paragraphes prcdents, dfinir prcisment ce quest la polysmie nest pas chose facile.
La polysmie, comme beaucoup dautres termes linguistiques, est une notion qui se laisse trs facilement apprhender de manire intuitive, mais qui se rvle beaucoup plus rtive une dfinition rigoureuse. On peut aisment se convaincre de la ralit et de limportance de ce phnomne, en donner de nombreux exemples, et en dcrire les principaux traits. Mais ces descriptions restent informelles, et ds que lon cherche dpasser ce niveau superficiel, pour tenter de caractriser exactement cette notion, den dterminer les limites prcises, den donner des critres dfinitoires, on se heurte la ncessit de construire un cadre thorique global, avec son lot de dfinitions axiomatiques et de postulats toujours discutables, qui nous loignent de la relation immdiate que nous entretenons avec la langue, et qui peuvent sembler dune complexit dmesure par rapport lobjet tudi. (Victorri & Fuchs, 1996 :11)

Pour omniprsente quelle soit, la ralit de la polysmie se heurte un cueil de taille dans la perspective dune systmatisation : la langue est en perptuelle volution et les units qui la composent en sont les lments les plus permables. Il faut bien sr des dcennies avant quune rgle grammaticale nouvelle simpose ou pour quune autre se modifie durablement. Toutefois, lapparition de nouvelles acceptions lchelon lexical est constante, gnralement imprvisible et
Nous citerons ici lexemple traditionnel du verbe voler, lequel possde deux acceptions majeures tymologie commune (le sens de drober tant issu dun des sens mineurs de se dplacer dans les airs, savoir poursuivre et chasser en volant (pour un faucon)). Il nest gure possible de rtablir un quelconque lien smantique entre ces deux acceptions aujourdhui.
35
7

passablement soudaine. Ainsi, la dfinition de la polysmie passe invitablement par la reconnaissance de cette mouvance incessante et par lacceptation du fait quaucune tude systmatique au temps prsent ne demeurera prenne moyen voire court terme. Nous reviendrons ce sujet sur quelques travaux lexicographiques (Trsor de la Langue Franaise, TLF) et lexicologiques (Dictionnaire Explicatif et Combinatoire de Meluk et Polgure, le DEC, Dictionnaire Intgral de Dominique Dutoit, Eurowordnet, etc.) soumis lrosion du temps et la ncessit de la gurir dfaut de la prvenir, ncessit qui nest dailleurs pas toujours suivie deffet. Aucune tude linguistique convaincante na ce jour essay daborder ostensiblement la question de la prospective en smantique lexicale. Dans une perspective plus ludique que scientifique, tout juste pouvons-nous citer nos propres travaux (Haton, 2004) mens en collaboration avec quelques collgues de lATILF (P. Bernard, W. Del Mancino, H. Gerner et E. Jacquey) dans le cadre du projet Polyglotron initi par la Cit de la Science Toulouse et pour lequel il nous avait t demand dimaginer quelques phrases en franais du vingt-septime sicle. Ce fut une tche certes ludique mais au contenu scientifique fort discutable. Dautres travaux, plus rcents et plus srieux , ont t lancs lATILF par Mathieu Valette (2004), lequel dans un premier temps a tent dexplorer par la morphmique les mcanismes de nologie lis aux textes racistes sur Internet. Dans un avenir proche, Mathieu Valette espre expliquer partir du mcanisme de nologie la manire dont les nouveaux sens vont merger partir des sens existants8. Lautre difficult lie la dfinition de la polysmie rside dans les termes qui la composent. Dans sa forme la plus lmentaire, la polysmie est le propre pour un mot de pouvoir prendre plusieurs sens. Cela impose de savoir et dexpliciter ce quest un mot, et galement ce quest le sens. Or, ces deux notions sont tout particulirement dlicates et font partie des autres termes linguistiques qui ne se laissent pas facilement dfinir, selon Victorri et Fuchs. Concernant le premier, il sagit de faire une diffrence initiale entre le mot en tant quartefact que lon peut directement apprhender par lobservation et le mtaobjet linguistique. Cette distinction sert paradoxalement de clin dil la polysmie en opposant le matriau lartefact, comme cest couramment le cas dans la langue. Il est encore plus difficile dapprhender le sens de sens. En ralit, il nest pas possible den donner une dfinition claire sans lassocier dautres notions ou des situations particulires o le sens est fig en une substance infrieure. En lexicographie, par exemple, le sens est restreint au cadre dfinitoire, de mme que le mot y est reprsent par une entre lemmatique. Dans un dictionnaire, un sens dun mot est une dfinition. Il est vident que cette restriction est rendue ncessaire par lusage que lon fait des ouvrages lexicographiques, mais elle ne permet en rien de
8

Perspective annonce et prsente lors dun atelier de rentre CNRS-ATILF-Nancy2. Septembre 2005.
36

rsoudre lnigme du sens car toute dfinition est circulaire, elle renvoie dautres units de la langue, lesquelles sont leur tour dfinies et ainsi de suite. Pour percevoir lessence du sens, il est ncessaire de retourner la racine, sa gense mme. Dun point de vue cognitif, le sens est ce qui prcde lexpression langagire et ne peut donc tre dcrit par le langage puisquil procde dun mcanisme qui est antrieur celui-ci. Cependant, peut-on caractriser lessence du sens au moyen du langage ? Et si oui, peut-on le faire sans risquer de retomber dans la circularit que nous venons de dcrire ? Un choix doit tre fait ici : soit nous considrons que le sens linguistique est toujours descriptible par la langue, auquel cas nous le dcrirons et en resterons l, soit nous admettons que le sens relve dune substance dun autre ordre, gar dans les ddales mystrieux des connexions neuronales. Et sur ce plan, nous nous dclarerons incomptent. Pour rester cohrent avec notre dmarche, et surtout pour nous autoriser continuer de parler de sens lexical, nous suggrons de ne voir dans cette notion de sens que le rsultat de lobservation des dictionnaires et des donnes, savoir quun sens dun mot renvoie une acception de celui-ci, ou plus prosaquement une description globale de cette acception (liens contrastifs lappui).

2.1.3 La polysmie a-t-elle plusieurs sens ?


La polysmie a-t-elle plusieurs senset vice-versa ? Les sens uniques mnent des impasses disaient Coulon et Kayser (1982). La polysmie dans son ensemble mne plutt au delta, serions-nous tent de rpondre en cho. La polysmie servant dabord dsigner la facult dun terme prendre plusieurs sens, nous pouvons nous demander si le terme est lui-mme polysmique, et par extension sil sert dsigner des concepts diffrents. A lorigine, la polysmie semble tre une facult car, selon Bral, un terme peut prendre plusieurs sens . Cest galement un tat (de langue) : un terme polysmique a plusieurs acceptions . Cest encore un processus, ou un mode de production, en cela que le langage autorise un terme prendre de nouveaux sens qui sajoutent aux prcdents . Cest aussi probablement un outil danalyse mtalinguistique puisque lon observe quun terme peut prendre des acceptions diffrentes selon le contexte o il apparat, ce qui conduit une description dgroupe de ses sens . Pour clore cette liste non exhaustive, nous proposons une vision de la polysmie en tant que phnomne systmatique (polysmie absolue) dont la dfinition porte les germes dune neutralisation de la notion de polysmie en tant que ralit du langage en dehors de la seule description linguistique. De ce point de vue, il sagit dun prolongement de la notion de polysmie en tant quoutil danalyse mtalinguistique.

37

2.1.3.1 De lhomophonie la polysmie absolue (le sens entre tout et partie dans le discours) Aprs avoir essay de synthtiser les positions traditionnelles au sujet de la polysmie, nous allons maintenant entreprendre de dessiner les contours de la notion telle que nous la voyons ou plus prcisment telle que nous allons la modeler pour quelle corresponde nos besoins. De notre point de vue, sens et rfrence forment effectivement un couple rabibocher selon lexpression de Georges KLEIBER (1999:51). En restreignant la description du sens un simple dgroupement dacceptions, la linguistique se trompe (ou se tromperait) dobjectif : le but nest plus de dlimiter la langue ou les faits de la langue, comme les grammaires et les dictionnaires sen chargent, mais plutt de proposer une tude de la langue telle quelle est ; cest--dire en replaant les noncs dans le rel (cf. Siblot, 1990) sans ignorer le fait que :
il y a une partie du sens qui est donne ou prconstruite, cest--dire conventionnelle ; (Kleiber, 1999).

Avant daller explorer les terres encore assez vierges de la polysmie absolue, il nous faut galement rconcilier deux approches de lanalyse du sens qui ne nous paraissent pas rellement incompatibles : la smantique compositionnelle et lapproche holistique (confrontes dans Gosselin, 1996). Selon la premire, le sens dun nonc est la rsultante de la somme de ses parties, i.e. des sens ports par les mots ou locutions qui le composent. Pour la seconde, en revanche, le sens dun nonc forme un tout indivisible distinct de la somme de ses parties. En observant les deux points de vue, nous remarquons quils sont au moins daccord sur un point, essentiel nos yeux : le tout, lnonc, a un ou du sens. Comme cela arrive souvent dans ce genre doppositions, les deux approches nous semblent avoir raison toutes les deux, avec les nuances qui simposent.

38

Lapproche compositionnelle considre que le tout est la somme de ses parties, mais ignore ainsi linvitable interinfluence des units discrtes9 mises au contact les unes des autres. Nous pouvons ce sujet rfrer la phontique et aux altrations que les phonmes se font subir mutuellement lorsquils sont accols les uns aux autres, rendant ainsi difficile une reconnaissance de la parole qui ne peut pas se contenter de prendre comme points de rfrence absolue les spectres individuels de chaque son pour analyser et reconnatre le discours dans son intgralit. Le processus nest bien entendu pas strictement quivalent dans la concatnation lexicale, mais le phnomne dinfluence mutuelle demeure : dans de nombreux cas, un nonc complet ne peut pas tre dcompos en units discrtes sens autonome ni paraphras par des lments discrets stricto sensu. Par exemple, lnonc suivant nest pas interprtable par la somme de ses parties : 1) Si vous continuez pitiner mes plates-bandes, vous allez voir de quel bois je me chauffe Dun autre ct, imposer au discours la vision holistique revient nier la persistance dune autonomie smantique des units discrtes qui le composent. Autrement dit, il est difficile de nier que lnonc dans son ensemble est constitu dunits plus petites que lnonc lui-mme, et que ces units ont des sens propres, des acceptions particulires dont le choix a t effectu en fonction des besoins du sens global. Dailleurs, sil ny avait pas prexistence des sens autonomes des units discrtes, il ny aurait pas de dictionnaires ni de sens lexical. Pour en conclure avec lopposition compositionnalit/holisme, nous accepterons une vision plus consensuelle et, nous lesprons, plus proche de la ralit du langage et de son rapport au sens : dans un premier temps, le sens pr-langagier existe sous la forme dune entit insaisissable qui ncessite la verbalisation pour tre rendu intelligible. En ce sens, il est effectivement holistique tant quil chappe la langue. En second lieu, il lui est associ un ensemble fini et ferm dunits langagires (nous pouvons penser aux mots et leur caractre discret en loccurrence) destin rendre au plus prs la ralit du sens primitif lensemble des interlocuteurs potentiels. Les noncs ainsi construits sont constitus de mots dont aucun nest choisi au hasard. Tous les mots sont retenus en fonction de leurs acceptions propres ou tout le moins du potentiel quils recouvrent. De ce point de vue, lnonc serait purement compositionnel et son analyse peut en apparence tre restreint ltude de ses constituants. En dfinitive, un nonc est la fois holistique et compositionnel. Tout dpend donc de la manire dont le linguiste entend rgler les problmes danalyse et dapplication. La solution personnelle trouver pour chacun est dabord dordre
9

Par unit discrte, il faut comprendre une unit qui possde une forme de base commune toutes ses variantes smantiques.
39

thorique. En ce qui nous concerne, notre position est de considrer que le discours est compositionnel dans la perspective de le modliser via les graphes lexicaux ; dautre part, nous admettons que tout nonc est holistique afin de faciliter lexplicitation de notre position sur la polysmie absolue : un sens dun nonc est tout autant la rsultante de facteurs linguistiques quextralinguistiques, ce qui rend originale et unique chaque production de parole. La vision du langage dpend galement du sens que lon donne au mot mot. partir de notre exemple 1), peut-on dire que pitiner les plates-bandes de et voir de quel bois je me chauffe sont des mots ou bien sont-ce des locutions polylexicales dcoupables en mots ? En observant cette phrase-exemple, on peut dailleurs lgitimement se demander si les deux locutions qui la composent ne sont pas des units discrtes part entire. Comme nous venons de le suggrer, admettre que tout nonc en contexte est distinct de tous les autres noncs produits conduit un largissement de la notion de polysmie la polysmie absolue (un emploi = une entre lexicale) pour se rapprocher par le haut de la reprsentation langagire, et consquemment du rapport multilingue. Avant de parler de positionnement thorique, lobjectif dclar est dessayer de modliser la langue telle quelle peut tre et non pas telle quelle est ou doit tre . Outre que cette vision du potentiel de la langue est dfendue par Dominique Dutoit dans ses recherches, nous faisons directement rfrence la rflexion de Rcanati ici. En effet, lauteur annonce en 1997 lapparition dune nouvelle vision de la polysmie : la facult quont les contextes de ne jamais tre semblables aucun autre. Partant du principe quil ny a pas deux situations dnonciation quivalentes, il ny a donc pas deux noncs sens identiques. Ce phnomne se rpercute au niveau du mot en vertu dune vision holistique du sens. Cette notion est reprise par Gosselin en 2001 sous le terme de polysmie contextuelle , et par un phnomne combinatoire polysmie contextuelle gnralise :
Le calcul smantique rencontre avec la polysmie contextuelle un obstacle dcisif. Par "polysmie contextuelle", on dsigne le fait qu'un marqueur (morphme lexical, grammatical, ou construction syntaxique) puisse prendre des significations au moins partiellement diffrentes en fonction des contextes linguistiques dans lesquels il se trouve. Comme ces contextes sont composs de marqueurs qui sont eux-mmes, le plus souvent, polysmiques, on parlera de "polysmie contextuelle gnralise" (PCG) pour dsigner le fait que la signification d'un marqueur puisse varier en fonction non seulement des formes, mais aussi des significations des autres marqueurs qui l'entourent (lesquelles varient aussi de semblable faon). Autrement dit, adopter le point de vue de la PCG, c'est, essayer de calculer l'interaction globale des marqueurs polysmiques dans l'nonc, et au-del, dans le texte.
40

La solution retenue pour rendre compte de cette PCG consiste admettre que les diffrentes instructions codes par les marqueurs constitutifs d'un nonc peuvent entrer en conflit, et que ces conflits sont rsolus par des procdures rgulires (et donc prdictibles) de dformation des structures smantiques. Ce sont ces procdures de rsolution de conflit que nous allons exposer de faon dtaille. On montrera aussi que ces mmes procdures permettent de rsoudre les conflits entre contraintes linguistiques (lies aux instructions smantiques) et contraintes pragmatico-rfrentielles, dans le cadre de la construction globale de la cohrence. Gosselin, 2001.

Dans une rflexion densemble qui peut tre assimile une pure conjecture, nous irons encore plus loin que Rcanati et Gosselin en reconnaissant tout dabord la divergence des contextes au sens large, jusqu la PCG mais en y adjoignant dautres divergences qui concernent les locuteurs de la langue. En loccurrence, chaque metteur a sa propre sensibilit linguistique, sa propre vision du sens des mots, inconsciente ou non. Les rcepteurs prsentent les mmes dcalages, avec en plus une dformation du sens encod qui est reu de manire non prvue par lmetteur. Autrement dit, le sens qui prcde lnonciation est diffrent du sens qui suit la rception. metteurs diffrents, rcepteurs diffrents et dformation du sens contribuent systmatiser la polysmie absolue, au risque de la rendre inutilisable en tant quoutil danalyse. Nanmoins, cette ambigut induite par la polysmie nentrane aucune hsitation ni vritable erreur dinterprtation de la part du rcepteur. De notre point de vue, il ny a pas incompatibilit dans les termes, il sagit surtout de lillustration dun invitable dcalage entre le sens encod par le locuteur et celui dcod par le rcepteur via un nonc. La polysmie absolue se rapproche en cela de la polysmie logique, laquelle correspond des sens contextuels apparents sans tre identiques :
Polysmie logique: (9)a. Ouvre la porte. Il fait chaud ici. b. Passe la porte et tourne gauche. () Polysmie logique: se produit quand un mot unique donne accs plusieurs sens diffrents mais lis. (Reboul, 1999)

En acceptant ce principe, nous suggrons une gnralisation de la ralit de la polysmie absolue : non seulement chaque occurrence dun terme constitue une entre lexicale part entire au sens de Rcanati, mais elle est elle-mme gnratrice de polysmie selon le locuteur qui linterprte. Ainsi caractrise, elle va bien au-del de
41

la description propose par Fuchs au sujet de la polysmie en suggrant que le choix de la bonne acception ne garantit pas luniformit de linterprtation dun rcepteur lautre. Une application pratique et indirecte de la polysmie absolue peut tre perue dans la production littraire, en cela que la relative libert de crativit des auteurs les conduit employer certains mots dans des sens trs inattendus, sinon soumis interprtation de la part du lecteur. Les crivains nprouvent jamais la ncessit dexpliciter certaines de leurs mtaphores, laissant toute libert leurs lecteurs de construire un nouveau sens lexical original, ou pas. Nous raccordons cette notion au phnomne de sphre dinfluence dune unit lexicale : dans notre esprit, une relation de traduction nest pas biunivoque mais sintgre dans un espace dont chaque point peut tre assimil une nuance subtile du sens habituel de la relation entre deux units10 (cf. Ploux, 1997, Ploux & Ji, 2003). Dun point de vue sociolinguistique, la polysmie absolue marque les dcalages invitables dans les comptences linguistiques des locuteurs dune langue ainsi que dans leur sensibilit tout court.

2.1.4 Des polysmies parallles


2.1.4.1 La polysmie verticale La polysmie verticale a t caractrise par GEVAUDAN (1997). Selon lui, elle dsigne la possibilit pour un terme de senglober lui-mme, dtre son propre hyperonyme. Lexemple mis en avant est celui de homme qui sert aussi bien dsigner lespce humaine dans son ensemble (concept englobant) y compris les femmes pour des raisons linguistiques, historiques et culturelles que lindividu de sexe masculin qui fait partie de lespce (concept englob).

10

Outre chez Ploux, on retrouve la dfinition du potentiel smantique dun mot comme un espace conceptuel assimilable un nuage de points (in Manguin & Franois 2004) chez Croft et Cruse (2004) : We can portray the total meaning potential of a word as a region in conceptual space, and each individual interpretation as a point therein. Understood in this way, the meaning potential of a word is typically not a uniform continuum : the interpretations tend to cluster in groups showing different degrees of salience and cohesiveness, and between the groups there are relatively sparsely inhabited regions (Croft & Cruse:109-110). Cette vision est parfaitement conforme la notre en matire de conceptualisation du sens lexical au sein dun espace clos.
42

En soi, ce phnomne nest pas trs loign de la polysmie simple, laquelle consiste en la cohabitation de diffrentes acceptions apparentes pour un terme unique. Nous noterons dailleurs que les deux acceptions ne peuvent pas se rencontrer dans un mme nonc, en labsence de qualification particulire sur au moins lun des deux, et encore cela ne fait-il pas vraiment partie de la langue telle quelle est rellement produite : 2) 3) 4) 5) Lhomme est un loup pour lhomme. ?? Un homme est une sorte dhomme. ? Dans les hommes, il y a les hommes et les femmes. ? Lhomme en tant quindividu de sexe masculin est un homme en tant que membre dune espce.

En cas demploi simultan des deux notions, lune dentre elles sera probablement remplace par son synonyme habituel : 6) Lespce humaine comprend les femmes et les hommes. De ce point de vue, il est difficile de parler de polysmie verticale sans tendre le champ de la notion. En premier lieu, en effet, la plupart des noms concrets autorisent deux lectures, une gnrique et une spcifique, lune englobant lautre sur le plan notionnel. Cela est particulirement vrai pour les noms despces animales ou pour tous les ensembles o lon a une dualit de genre ou de sexe. Ensuite, ce phnomne peut tre tendu aux verbes car ceux-ci peuvent tre considrs comme hyperonyme ou hyponyme deux-mmes, lobservation de leurs acceptions dans un dictionnaire courant. Le verbe abandonner a par exemple un nombre dacceptions assez faible qui toutes peuvent tre englobes smantiquement par un sens primitif peu dtaill qui peut correspondre littralement une dfinition valable dabandonner. Il y aurait par consquent un proto-verbe abandonner qui exerce sa prdominance verticale sur toutes ses acceptions. Nous nous servirons de ce point de vue pour crire une primitive smantique de ce verbe afin de faire ressortir lhomognit de ses emplois. 2.1.4.2 La polysmie logique Caractrise par James Pustejovsky (1996), la polysmie logique dsigne le phnomne de cohabitation entre deux acceptions en apparence contradictoires mais lies pour le mme objet linguistique (cf. Jacquey 2001). Lexemple le plus cit est celui de livre, dont chaque rfrent est aussi bien un artefact, objet manipulable, quun contenu informationnel. Lartefact possde une forme, une apparence, des couleurs et toutes autres caractristiques de son tat. Le contenu informationnel peut tre qualifi de plus ou moins intressant , de plus ou moins bonne qualit , etc. Il peut y
43

avoir concurrence entre les deux acceptions car, certes elles dsignent le mme objet, mais elles ne peuvent pas toujours tre employes conjointement dans la mme occurrence, sauf contraintes particulires portant sur la qualification : 7) Le livre est rouge (artefact) 8) Le livre est intressant (contenu) 9) *Le livre est rouge et intressant (conflit artefact/contenu) Si le mode attributif ne peut qualifier les deux sens en mme temps, ceci nempche pas de les confronter ds lors que la qualification porte dj sur livre en position dpithte : 10) Le livre rouge est intressant 11) Ce passionnant livre est rouge Dans un souci de caractrisation du sens, il est difficile de dire que lon a affaire deux sens diffrents dun mme terme puisque les deux dfinitions peuvent renvoyer au mme objet, en loccurrence lartefact livre et son contenu. En essayant dtendre cette notion aux verbes, nous nous apercevons que ces derniers rsistent la polysmie logique car leur rayonnement smantique en tant que prdicats touche directement les arguments qui laccompagnent. Par exemple, on acceptera difficilement : 12) ??Jai abandonn ma lecture (ou mon livre) et mes enfants, non pas parce que le sens du verbe est profondment diffrent mais parce que ses arguments objets induisent une incompatibilit subtile qui bloque leur co-occurrence. Nous verrons vers la fin de ce chapitre comment Pustejovsky applique ce principe pour expliquer pourquoi certains verbes autorisent la sous-catgorisation dobjets qui ne sont pas prvus dans sa structure tlique habituelle (cas de to bake).

44

2.1.5 Polysmie et traduction11


2.1.5.1 Opposition de mondes lexico-conceptuels
2.1.5.1.1 Instabilit intgrale

Dans louvrage collectif La Traductique (1993), linstabilit des mondes lexicoconceptuels de langues diffrentes est prsente de la faon suivante par Pierrette Bouillon :
Lanalyse des langues naturelles se heurte en effet au problme de lambigut des langues naturelles, ambigut la fois lexicale et structurale. On parle dambigut lexicale, quand un mot peut recevoir plusieurs catgories syntaxiques ou significations. Ce terme englobe aussi les ambiguts bilingues (ou contrastives) qui dsignent deux mots qui, tout en tant la traduction lun de lautre, ne dnotent pas exactement le mme concept ou le mme ensemble de concepts. Le terme dambigut structurale fait rfrence une phrase qui peut tre dote de plusieurs reprsentations. Bouillon (1993 :19)

Laccent est mis sur les cueils successifs de lambigut des langues naturelles et des ambiguts bilingues . La premire est mise en vidence par lactualisation des dictionnaires, comme nous le dcrivons par ailleurs, ainsi que le caractrise Paul IMBS lorsquil parle de continuum instable pour dsigner le lexique dune langue (Introduction au premier volume du TLF, 1963). On la retrouve galement dans le phnomne de polysmie et de polymorphie, dans la mesure o peu dunits de la langue prsentent une relle stabilit smantique et/ou syntaxique. Les ambiguts dites bilingues sont tout aussi nombreuses et complexes. Tout dabord, les mondes lexico-conceptuels de deux langues diffrentes ne sont pas parallles, i.e. un mot dune langue donne ne correspond presque jamais un mot et un seul dans lautre langue. Les dcalages entre les concepts ou les ensembles de concepts sont donc la rgle. Dautre part, certains pans de la langue ne peuvent pas tre rendus par la traduction, comme cest gnralement le cas pour les jeux de mots12.
Il sera davantage question ici des problmes lis la traduction et aux ambiguts diverses qui peuvent exister entre les langues que du rapport stricto sensu entre polysmie et traduction. 12 Nous citerons un exemple tir du roman de John Irving, lpope du buveur deau , o le traducteur se voit oblig de signaler en note quil ne peut pas rendre en franais le comique gnr par la version anglaise. Dans cet exemple, une dame demande son mari ce qui arrive leur fils : Quest-ce qui se passe ? Vrole, lui crie-t-il ! et la dame tape des mains en silence. Ce jeu de mots est intraduisible puisque clap en anglais signifiait aussi bien applaudir (comme traduction de to clap) que vrole en langage familier. On trouve rgulirement ce genre de note de bas de page dans les romans traduits.
45
11

2.1.5.1.2

Lambigut selon lHumain

contexte suffisant, on ne rencontre pas vraiment dambiguts relles dans la langue. Tout le monde connat le processus de polysmie et la polysmie nest pas lambigut nous rappelle Catherine Fuchs en 1996. Quand une autre langue est en jeu, le danger du dcalage augmente bien entendu. Pour autant, nous ne traiterons pas de la traduction littrale car, bien quelle semble proche de la traduction mcanique, elle relve avant tout dune forte incomptence linguistique qui fait tablir une biunivocit syntaxique et lexicale absolue dfaut de matriser les dcalages. Pour illustrer le faible impact des ambiguts sur lhumain, Pierrette Bouillon propose les exemples suivants : 13) La fermire a tu la vache parce quelle ne donnait pas de lait 14) Je vois lhomme avec le tlescope Selon elle, la premire phrase nest pas ambigu pour ltre humain, cest une ambigut accidentelle que la machine aura rsoudre. Quant la seconde, elle serait ambigu pour lhumain comme pour la machine, soit relle. Notre lecture innocente de ces deux phrases montre quel point la notion dambigut applique des exemples construits nest gure convaincante quand elle est premptoire. En effet, la phrase (14) nous semble plus improbable quambigu et ne relve pas vraiment de la sphre de la langue, moins de ne correspondre qu la seconde interprtation (cest lhomme qui tient le tlescope). Quant la (13), nous avons tout de suite imagin, avec un rien de mauvaise foi, une pauvre fermire ne donnant pas de lait et tuant sa vache de rage. Ce type dambigut est intrinsquement li la non-saturation apparente du rfrent du pronom qui suit la proposition principale (elle dans (13)). Observons maintenant lextrait suivant tir de la fable de la Fontaine le cheval et lne :
() Un ne accompagnait un cheval peu courtois, Celui-ci ne portait que son simple harnois, () Jean de La Fontaine

partir de cet exemple, Maingueneau (2003 : 221, 236-237) propose une interprtation du pronom anaphorique celui-ci en ces termes :
La reprise par celui-ci permet dviter lambigut de lanaphore. Maingueneau (2003 : 237)

Si le pronom dmonstratif est bien dsambigusant, cela suppose que lexemple (13) propos par Pierrette Bouillon doit tre considr demble comme ambigu.
46

Lutilisation de celle-ci aurait permis de rattacher son rfrent celui de la vache, ce qui nest pas le cas ici. En dfinitive, une telle ambigut apparente est en principe rsolue par notre connaissance du monde, linterprtation de la vache comme tant ltre qui ne donnait pas de lait prime par consquent sur lautre. Toutefois, rien ninterdit de penser que la fermire ne puisse pas donner de lait, il sagit dune situation envisageable dans le monde o nous sommes, mme si cela napparat pas spontanment comme tant le meilleur choix pour cette occurrence. En dfinitive, gnrer de lambigut en discours est un exercice difficile et prilleux dans la mesure o les analyses sont elles-mmes potentiellement ambigus, comme nous avons essay de le montrer, surtout si les exemples sont construits et analyss en dehors dun co-texte dsambigusant. Il nen est pas moins vrai quon sentend souvent dire par des relecteurs ou des auditeurs : quoi as-tu voulu relier ce complment ? , le sujet de ta phrase, cest lequel ? . Ds quon dpasse la structure simple Sujet-Verbe-Objet, le risque augmente daboutir des ambiguts structurales, beaucoup plus frquentes que les lexicales qui profitent plus du co-texte pour tre rsolues demble.
2.1.5.1.3 et selon la machine

Pour la machine, tout est ambigu par dfinition et rien nest ambigu par absence de raisonnement conscient. Lhumain comme la machine biaisent aisment lambigut structurale dans le cas o les langues mises en rapport sont proches :
Si la rsolution de toutes les ambiguts accidentelles nest pas toujours ncessaire pour traiter des langues proches, elle est malheureusement indispensable pour traduire correctement des langues de familles plus loignes. Ainsi, dans un systme qui traite du franais et de langlais, lambigut de la phrase 1 (NDLR : Lhomme a vu le cheval avec le tlescope) ne doit pas tre leve et il suffit dordonner les modificateurs de la mme faon dans les deux langues. Mais dans un systme qui traduirait vers le japonais, cette distinction deviendrait obligatoire pour produire une phrase syntaxiquement correcte. Il est donc souvent ncessaire de choisir la bonne interprtation, ce qui ncessite des connaissances linguistiques, contextuelles, gnrales, ou statistiques et mme des capacits de raisonnement. Si les recherches ont beaucoup progress dans ce domaine, la reprsentation et lintgration de ces sources de connaissances restent encore souvent exprimentales et on se pose souvent la question de savoir jusqu quel point ce type dinformations est suffisant et adquat pour rsoudre les problmes danalyse. Bouillon (1993 :19)

Un peu plus loin, Pierrette Bouillon pointe sur un problme dautant plus important quil est difficile traiter : la prise en compte des variantes contextuelles
47

dans linterprtation des noncs. Cest la connaissance de ces variantes qui permet lhumain de ntre presque jamais dcontenanc par la polysmie des termes mis en rapport, alors que la machine nest que rarement capable de la dpasser :
la plupart des systmes traduisent phrase par phrase, sans en tenir compte (op.cit.).

Il reste que la machine ne peut rsoudre que ce quon lui a appris rsoudre. Ds lors que les bonnes rgles lui sont apprises, un programme informatique cessera de gnrer de reprsentations identiques pour des formes identiques, et sadaptera aux nouveaux modles implants la hauteur de leur qualit. Pour cela, les systmes de traduction automatique qui entendent tenir compte du co-texte doivent passer par lcriture de rgles n-grammes et par la prise en compte des lments cotextuels appropris (dits dclencheurs ou triggers en anglais). 2.1.5.2 Les vraies relations dun terme avec ses traductions Proposer une traduction dun terme source revient proposer un quivalent contextuel de celui-ci. Dans la plupart des cas, les traductions ne sont pas univoques, cest--dire que la plupart des lexies ont plusieurs traductions (parfois normment) et que chacune de ces traductions peut tre considre comme la plus approprie ou la meilleure pour un contexte donn. Lexemple du verbe abandonner, que nous prsentons par ailleurs au chapitre II, est une excellente illustration du potentiel dessaimage smantique dune unit polysmie peu marque. En regard de la lexicographie monolingue, abandonner et les verbes qui lui ressemblent sont soumis une polysmie assez faible dans le sens o il existe un noyau de sens commun toutes les acceptions du verbe. Ce qui est notable, cest que les traductions de ces verbes en contexte se choisissent en fonction des arguments satellitaires du verbe bien davantage quen fonction de lacception quils induisent. De ce fait, les critres distinctifs dont on aura besoin pour slectionner les traductions justes seront plus axs sur les structures argumentales (collocations) et sur les normes de registre et de contexte qui ne sont pas ncessairement lies au dgroupement initial des verbes en acceptions. Comme dit prcdemment, chaque traduction est suppose incarner la meilleure de sa catgorie. Toutefois, il sagit l dun point de vue difficile systmatiser dans la mesure o certains termes cibles restent des seconds choix ou des avatars de contextes luxueux, ce qui explique en partie leur absence des dictionnaires en tant que candidats visibles. Outre les exemples dj mentionns pour les traductions rares du verbe abandonner, nous pouvons citer la longue liste des verbes italiens traduisant aborder ou tant traduits par ce verbe : plusieurs de ces derniers sont des termes littraires ou dsuets qui nont pas lieu dapparatre comme candidats directs selon le rdacteur (avvicinare, appropinquare) ; dautres, comme sbarcare, possdent
48

des acceptions qui voquent la spcialisation ou lextension dune des acceptions de aborder en franais sans toutefois en tre suffisamment proches pour le traduire directement. Nous tudierons en dtail cette relation au chapitre II. Dans de nombreux cas, les dictionnaires bilingues proposent deux, parfois trois, trs exceptionnellement quatre traductions pour un mme terme dans des conditions demploi quivalentes. Dans une telle situation, il ny a que rarement mention dune hirarchie prfrentielle entre ces traductions proposes, ni davantage de marqueurs demploi spcifiques. Si lon en reste la lecture brute de lentre du dictionnaire, il est permis de considrer ces diffrents candidats comme des quivalents contextuels en langue cible. Or, on admet quil ny a stricte quivalence smantico-lexicale dans une langue donne que par accident, ce qui complique notre vision du lexique. La synonymie accidentelle est tout de mme lvnement le plus saillant dans une telle situation. Consquemment, les traductions entretiennent entre elles des relations de type synonymique, dites contextuelles car lies un emploi particulier prcis par le dictionnaire. Pour comprendre comment fonctionne le paradigme de traductions des traductions, il faut aller observer le processus de balayage13 et ce qui en dcoule. Par le jeu du miroir qui ne rflchit pas14 , la traduction dune traduction nest pas statistiquement le mot traduire initialement, do dailleurs la raison dtre fondamentale de notre thse. Cest galement le moyen dvaluation pour le systme de traduction SYSTRAN. En recourant systmatiquement ce mode de double lecture, la concurrence entre traductions peut partiellement tre rsolue. Toutefois, il sagit dune gymnastique contraignante qui noffre pas de ferme garantie quant au rsultat. Aprs avoir explor la notion de polysmie puis tabli que les traductions entretenaient des rapports dquivalence subtils et codifis, nous nous retrouvons face quelques questionnements de poids : Une traduction peut-elle tre considre comme le synonyme en langue cible de la lexie15 source ? Et dans ce cas, la meilleure traduction nest-elle point le meilleur synonyme dune lexie, au moins sur le plan thorique ? Plus globalement, deux mots de langues diffrentes peuvent-ils tre perus comme synonymes lun de lautre ? En tant de la dfinition de la synonymie le trait dquivalence idiomatique, il reste que le signifi est potentiellement le mme dans toutes les langues, simplement ralis par des signifiants diffrents. Dautre part, les traductions des traductions ajoutent des traits de synonymie jusqualors invisibles, lesquels viennent sinsrer dans un rseau global de proximit smantique.
13

Le balayage est le processus de rcupration des donnes que nous utilisons pour construire nos bases. Son mode de fonctionnement a t voqu dans lIntroduction et sera plus largement dcrit aux chapitres II et V. 14 Cest--dire la confrontation du LI et du LD sans faire leur fusion. 15 La lexie est prendre dans le sens de Meluk et alii, eux-mmes stant inspirs de la dfinition de Pottier (prsent chapitre, 2.3.1).
49

Dans leur prsentation du programme de traduction ULTRA (in Bouillon & Clas, 1993), Helmreich, Jin, Wilks et Guillen dfinissent la notion dquivalence de traduction aprs avoir discut des diffrents niveaux dambigut qui perturbent lexercice de traduction automatique16. Les diffrentes ambiguts quils relvent sont au nombre de quatre : lambigut lexicale. Elle correspond au croisement entre la polysmie inhrente au lexique de chaque langue et les traductions possibles dans une autre langue. Un mot dune langue a potentiellement plusieurs sens et donc potentiellement plusieurs traductions en langue cible. linverse, plusieurs mots dune mme langue peuvent tre traduits par un et un seul mot dans une autre langue (cas de to hope, to wait for et to expect traduisibles par le mme verbe espagnol esperar) ; lambigut syntaxique. Cette dernire complique la situation car une phrase structurellement ambigu dans une langue ne lest pas forcment dans une autre (les auteurs reprennent la phrase de Bouillon en anglais I saw the man with the telescope dont la structure doit tre dsambiguse car la traduction chinoise varie () (Helmreich et alii, 1993 :336)) ; lambigut smantique. Elle concerne notamment les cas de sens figurs, les mtaphores et les mtonymies pour lesquels une traduction littrale nest pas souvent possible. Sans ambigut syntaxique, un nonc peut souvent avoir un sens littral et un sens figur ce qui complique un peu plus la tche de dsambigusation et de traduction. L aussi, ce problme induit quon sache pourquoi un nonc est produit afin de savoir ce quil veut dire ; lambigut discursive. Rsoudre la question de la recherche des rfrents des anaphores est une opration dlicate et ncessaire car elle
16

Lune des caractristiques communes aux langages naturels est son ambigut. Le nombre dinterprtations possibles dune phrase donne dans une langue est en effet trs important et est caus par le fait que chaque phrase est approprie un grand nombre de situations. La smantique situationnelle parle ce propos de l efficacit du langage (Barwise et Perry 1983). La phrase il nest pas l , par exemple, peut tre prononce dans des circonstances trs varies avec des interprtations diffrentes de il et de l . () (Helmreich, Jin, Wilks et Guillen, 1993:335-336). On reconnat dans ces lignes les tenants de la polysmie absolue et, demi-mot, linfluence du contexte pragmatique sur linterprtation des noncs : dsambiguser les anaphores et dictiques ne suffit pas, il faut galement savoir pourquoi un nonc est produit, comme les auteurs le prcisent dailleurs pour expliciter le fonctionnement de leur programme.
50

conditionne beaucoup de critres syntaxiques et lexicaux dans une langue cible. Pour traduire en franais le texte anglais John took the fruit from the table. Then he cleaned it, il faut dcider si John a nettoy le fruit ou la table, puisque cette information est ncessaire pour dterminer le genre du pronom () et parfois aussi le choix du verbe. (ibid. : 337). Dans cet exemple, heureusement, il ny a pas dambigut sur lautre pronom, savoir he , qui ne peut se rapporter qu John . Une fois les diffrents niveaux dambigut dfinis, et ventuellement rsolus, on saperoit que la question de lquivalence interlangue est toujours en suspens car la dsambigusation nimplique pas la rsolution de tous les problmes lis la traduction. En effet, les obstacles lis la non biunivocit entre les lexiques, les grammaires et mme les cultures pour chaque langue demeurent. Pour autant, nous avons choisi de ne pas remettre en question notre principe dquivalence qui consiste en lacceptation quune meilleure traduction dun terme source dans un contexte donn constitue le meilleur synonyme de ce terme parmi dautres meilleurs synonymes dans dautres contextes. En mlant cette vision au phnomne de la polysmie absolue, nous parvenons linterrogation suivante : Y a-t-il toujours un meilleur candidat pour tous les contextes dapparition dune vedette ou bien est-ce une proposition pour pallier les effets de la polysmie contextuelle ? Autrement dit, il ny aurait meilleur candidat quaprs passage dans le filtre sens dorigine/encodage/interprtation, et ce seulement si le problme li lquivalence a t surmont.

2.1.6 La polysmie remise en question


En acceptant une fois pour toutes la pertinence du parti pris de la polysmie absolue ou systmatique, selon laquelle chaque occurrence dun mot est dissemblable de toutes les autres, on aboutit une forme de neutralisation de la polysmie dcrite depuis Bral. Avant den arriver ce point, notons que la polysmie en tant que concept est irrductible dans le travail mtalinguistique pour expliquer le potentiel et lvolution smantique dune forme donne, et indispensable en mtalexicographie pour prparer et dtailler le dgroupement des termes en acceptions aux caractristiques diffrentes. Autrement dit, prtendre notre niveau et pour ouvrir laccs nos modes de reprsentation personnels que la polysmie nexiste pas nempche pas la notion dexister en tant que concept essentiel pour lanalyse linguistique. Ds que lon quitte le niveau de mta-analyse et que lon cherche rtablir lintgralit des facteurs qui participent linterprtation des noncs en situation, la polysmie se dilue peu peu au contact des discriminateurs forts que sont le contexte
51

(au sens large) et les perceptions conjointes et volontiers incompatibles de lencodeur et de linterprteur, lesquels nont videmment pas la mme vision de la situation dnonciation ni de la finesse du sens, et consquemment font que les locuteurs dune mme langue voient chaque occurrence diffremment de leurs co-locuteurs. En considrant ds lors que la polysmie est, au niveau de lnonc, un phnomne systmatique qui permet de caractriser la diffrence entre deux occurrences identiques en forme mais dans des contextes diffrents, nous aboutissons une premire neutralisation de la notion en ce quelle reprsente fondamentalement. Par ailleurs, un mme couple nonc-contexte sera interprt diffremment par des locuteurs distincts mais sans en dnaturer le sens originel, ce qui conduit une seconde neutralisation au niveau le plus fin, celui de linterprtation exacte : le niveau du rcepteur indivisible. Il serait fastidieux daller rechercher un troisime niveau de neutralisation visant dmontrer quun seul interprteur est susceptible de projeter plusieurs significations sur un mme couple nonc-contexte, dans la mesure o ce processus na pas de fin. En guise de conclusion notre rflexion sur la polysmie absolue, il est manifeste que cette dernire na plus une utilit majeure dans le cadre de nos travaux, puisquelle est absolue justement, et que ce nest pas en son nom que nous allons dfinir les liens qui unissent les lexies dans nos reprsentations. En revanche, elle demeure indispensable en tant quoutil danalyse en mtalangue pour les smanticiens et les lexicographes soucieux de rduire le sens des formalisations ou des rdactions taille humaine. Pour une poursuite de la rflexion, nous renvoyons Rastier et Victorri au sujet de lopposition entre type (lment ultra-polysmique puisque utilisable dans un nombre infini de contextes) et occurrence (lment monosmique). Pour viter les effets nfastes de ce que nous venons de dcrire, il nous a fallu effectuer un dtour par la synonymie afin dexpliciter non plus le fonctionnement interne dun lexme en fonction de ses entres lexicales mais plutt le type de liens quentretient une lexie avec les autres lexies. Pour ce faire, nous allons explorer le mcanisme de la synonymie orient vers nos besoins, en noubliant pas de dfinir plus prcisment les units lexicales minimales sur lesquelles nous voulons travailler. En dfinitive, toute notre rflexion mne la conclusion quil existe deux polysmies bien distinctes qui ne sauraient finalement tre opposes sur un mme plan.

52

2.2 Synonymie 2.2.1 Dfinition


Dans notre esprit, la synonymie est en quelque sorte la polysmie du sens primitif, celui qui nest pas directement verbalis. Voici quelques dfinitions de la synonymie :
Synonymy Semantic relation of sameness or (strong) similarity in meaning of two or more linguistic expressions. In lexicology, grammar, or stylistics it is a term whose interpretations are as varied as the semantic theories in which it is found. () Bussmann (1996:470)

Ce qui revient dire que la synonymie, comme la polysmie du reste, est une notion qui ne se laisse pas facilement apprivoiser dans les thories linguistiques, comme nous le savons depuis bien longtemps.
The following distinctions are generally made. (a) Complete (absolute, strict or pure) (): by definition, complete synonymy presupposes the unconditional substituability of the given expressions in all contexts and refers both to denotative and to connotative semantic elements. () it appears that the concept of linguistic economy eliminates, in almost all cases, the possibility of complete synonymy at least in lexemes. (b) Partial synonymy, which refers either to lexemes which can be substituted in some but not all contexts () Bussmann (op.cit.:470-471)

Daprs cette dfinition, la seule synonymie rellement active dans la langue est la synonymie partielle, car la synonymie complte suppose doutrepasser le principe dconomie linguistique, laquelle prvaudrait sur la possibilit de substituer une unit une autre dans tous les contextes. Le mme dcalage existe dans un rapport interlangue pour des raisons extrieures lconomie du langage : il ny aucune raison a priori pour que deux langues adoptent le mme systme lexico-conceptuel dans une parfaite symtrie (ce qui au demeurant rendrait inutiles les recherches en traductologie).

53

2.2.2 Application aux lexiques multilingues


Les traductmes17 sont assimilables des synonymes contextuels parfaits du mot quils traduisent. Ils respectent la dfinition de la synonymie de Bussmann en ce qui concerne les synonymes partiels. Dautre part, cette dfinition ne mentionne pas de restriction au sujet de la langue des units mises en rapport. Nous en dduisons que deux mots de langues diffrentes peuvent tre synonymes lun de lautre. Cest partir de ce postulat que nous allons mener notre constitution dun algorithme de construction de graphes lexicaux. Entre la synonymie et la polysmie, pour le choix de la meilleure matire notionnelle pour la suite de nos travaux, la question ne se pose pas rellement en terme defficacit mais plutt dun point de vue de la ralit linguistique. Toutes les relations dfinies au moyen dun dictionnaire bilingue se ramnent des liens de synonymie ou ressemblant de lquivalence smantique. Dune certaine faon, nous soutenons que la synonymie est probablement moins un artefact linguistique que ne lest la polysmie, dans la mesure o la premire est frquemment induite par un mcanisme conscient, soit pour trouver des quivalents dans le discours, soit pour rechercher des quivalents en traduction. La synonymie induit une stabilit du sens ou tout le moins une forte ressemblance entre sens. Les liens de synonymie que nous allons dfendre au chapitre IV concernent non plus des units lexicales au sens large, i.e. des formes, mais des emplois particuliers de chacun des mots mis en rapport. La polysmie absolue transforme un mot en une multitude dentres lexicales caractrisables (en thorie). La synonymie contextuelle va linverse juguler lexpansion induite par cette ultra-polysmie en restreignant les units lexicales aux couples acceptions-traductmes prsents dans les dictionnaires. En des termes plus simples, nous dirons quil ny a pas smantiquement plus proche dune entre lexicale que ses synonymes, dun point de vue lexical ; en tout tat de cause un synonyme dune entre lexicale dune unit polysmique est toujours plus proche de la premire que de toutes les autres entres lexicales de lunit polysmique. Pour exploiter ces notions dans loptique de notre modlisation, nous allons maintenant expliciter quels lments lexicaux nous allons observer, et quelle terminologie adopter, commencer par la lexie telle que Pottier (1991) et Meluk & alii (1995) lentendent.

17

Un traductme est un mot propos en traduction dun autre mot selon des critres de slection prcis. On peut lassimiler la plus petite unit de traduction pour une expression donne.
54

2.3 La place des lexies dans le lexique : dfinitions et notions 2.3.1 Quest-ce quune lexie
A linstar de Meluk, Clas et Polgure (1995), nous utilisons la lexie comme unit de base pour nos reprsentations. La dfinition dune lexie pose certains problmes, en particulier celui dtre tributaire du concept de mot, lequel nest pas prcisment dfini en linguistique :
La lexie est lunit de base de la lexicologie en fait, son objet central et mme, en schmatisant un peu, son seul et unique objet. Par consquent, le concept de lexie devrait tre dfini ds prsent de faon rigoureuse et muni de toutes les explications indispensables. () Le concept de lexie est une formalisation et, simultanment, une gnralisation de la notion de MOT. Il nest pas dans notre intention dentreprendre ici une analyse pousse de cette notion, mme si lon sait bien que le mot est une unit centrale de la langue : on connat tout aussi bien le caractre rtif du mot mot, qui, jusqu prsent, a chapp aux tentatives de le circonscrire avec prcision et a fait couler beaucoup dencre pendant des dcennies. () Pour le moment, il nous suffit de dire quune lexie18 ou unit lexicale, est soit un mot pris dans une acception bien spcifique (= lexme), soir encore une locution, elle aussi prise dans une acception bien spcifique (= phrasme). Ainsi, si nous considrons le mot PONT, nous pouvons en dgager, de faon intuitive et en nous fiant des dictionnaires, peu prs une quinzaine de lexies () : Lexie 1 : PONT au sens de construction reliant les deux rives dune tendue deau ; Lexie 2 : PONT au sens de jours chms entre deux jours fris ; Lexie 3 : () De plus, on connat toute une srie de locutions comprenant le mot PONT, qui constituent dautres lexies : Lexie 6 : PONTS ET CHAUSSEES au sens de service administratif des voies publiques ; Lexie 7 : PONT AUX NES au sens de banalit connue de tous ; Lexie 8 : PONT AERIEN au sens de liaison rgulire par avion entre deux points ; Lexie 9 : COUPER LES PONTS [avec N] au sens de cesser dlibrment les relations [avec N] ; Telle que prsente dans ces exemples, une lexie est une entit trilatrale : elle a un sens (le signifi saussurien),
18

Les auteurs prcisent quils emploient ce terme tel que propos et dfini par B. Pottier (1991)
55

une forme phonique/graphique (le signifiant saussurien), et un ensemble de traits de combinatoire (le syntactique de la thorie SensTexte : Meluk 1993 : 117). Meluk, Clas & Polgure (1995 : 15-16)

Ainsi dfinie lunit lexicale, dite lexie, soppose au lexme, distincte du mot en cela quelle est caractrise par un couple forme-acception. Le lexme est dabord du domaine du signifiant, modre par des critres distinctifs fonds sur les diffrences catgorielles (homographie avec catgories grammaticales diffrentes), lorigine du mot (homonymie par tymons diffrents) et lloignement de ses acceptions contemporaines (homonymie de sens synchronique). Toutefois, ce dernier critre est peut-tre discutable en lexicographie. Lunit lexicale est pour sa part tributaire la fois du signifi et du signifiant, avec des variations de finesse dans sa description en fonction des choix du lexicologue. Pour la suite du prsent document, nous choisissons de suivre grosso modo les dfinitions proposes par Meluk et alii. Par consquent, nous utiliserons lexme ou terme pour dsigner le verbe en tant quentit polysmique non marque ; par ailleurs, nous emploierons lexie pour faire rfrence au verbe pour un sens particulier19. Les lexiques inverss que nous avons construits et que nous dfinissons au chapitre II sont des ensembles de lexmes candidats multiples. Les bases lexicales qui leur sont associes sont des paradigmes de lexies, chaque ligne faisant rfrence un type demploi bien dtermin (traductions, collocations et donnes extralinguistiques20 lappui). La dfinition de la lexie selon Meluk nexclut pas la prise en compte des lments polylexicaux. tant donn la grande varit de ces derniers, nous allons essayer de fixer les limites qui permettront un terme constitu de plusieurs units dentrer dans nos modles.

2.3.2 Peut-on tre polylexical et homogne en mme temps ?


Aprs avoir pass en revue un certain nombre de dfinitions non superposables de diffrents auteurs (Jespersen, Pottier, Benveniste, Martinet, Larousse, Darmesteter, Fonagy, Mathieu-Colas, Guiraud, Catach) concernant le figement, les expressions idiomatiques, le mot compos, la composition, etc., Gaston Gross propose une classification simple, issue de la synthse des premires, en
19

savoir pour un ensemble de traits de slection suffisants pour aboutir une traduction unique. 20 Les donnes extralinguistiques sont les lments non langagiers de la situation dnonciation qui interviennent dans la slection des candidats la traduction. On en rencontre peu dans les dictionnaires car leur nombre potentiel est trop lev par rapport aux capacits de ces derniers.
56

distinguant deux grandes classes de mots, les mots simples21 et les mots construits22, ces derniers donnant lieu une nouvelle distinction entre mots drivs et mots polylexicaux :
Parmi les mots construits nous distinguons : -les mots drivs, ceux qui sont forms laide dun affixe : prfixe (refaire) ou suffixe (travailleur) ; -des mots polylexicaux (ou mots complexes), correspondant toute unit (ou catgorie grammaticale ou partie de discours) compose de deux ou de plusieurs mots simples ou mots drivs prexistants (). Cette dfinition sapplique des termes comme jardin dagrment mais non des suites du type le jardin de ton pre, qui est groupe nominal comprenant un substantif simple et sa dtermination. Alors que les mots drivs sont toujours souds, les mots polylexicaux (ou complexes) peuvent tre souds (outrepasser, et alors, du point de vue informatique, ils peuvent tre assimils des mots simples) ou comporter un sparateur (blanc, apostrophe, trait dunion, etc.). G. GROSS (1996 : 7)

Comme le prcise lauteur un peu plus loin, le problme de la soudure na pas la mme porte ni la mme signification dune langue lautre. En effet, le systme lexical de lallemand intgre la soudure comme procd de drivation systmatique en une seule unit monolexicale construite, l o en franais il est possible - et gnralement plus frquent - de proposer un syntagme nominal non soud (voir lexemple de lallemand lmhle traduisible par moulin huile). De ce point de vue, nous allons tre confront un choix dlicat : Devrons-nous traiter systmatiquement les mots complexes non souds ds lors quils ne sont pas des groupes nominaux libres ? Ou nous contenterons-nous dintgrer comme lexies les ensembles composs sens opaque ? Les deux solutions posent problme. En effet, dune part, traiter moulin huile comme un lexme normal induit la prise en compte dun nombre incalculable de mots polylexicaux en franais ; dautre part, les ignorer dans le champ dtude risque de poser un problme de correspondance interlexicale au moment o nous entendrons traduire lmhle. La solution provisoire que nous prconisons est dabord dadmettre lextension de la notion de lexie des compositions non opaques comme moulin huile, moulin farine, etc. Dune certaine faon, le phnomne de drivation dcrit plus haut pour lmhle et moulin huile ne pose pas vraiment de problme de correspondance si les processus de drivation sont stables et donc aisment reprables en franais et en allemand. En revanche, en labsence dune stabilit totale dans le processus de gense des mots construits, comme nous pouvons nous y attendre, nous
G. Gross appelle mot simple ou mot racine toute unit qui nest susceptible daucune dcomposition, comme lune, travail ou petit. 22 Toujours selon G. Gross, tout mot qui ne rentre pas dans la catgorie des mots simples est dit construit.
57
21

devrons nous contenter dintgrer la liste des lexies les mots polylexicaux que les dictionnaires bilingues font apparatre comme vedettes (traduits par des mots monolexicaux ou polylexicaux) ou comme candidats (traductions de mots monolexicaux ou polylexicaux). Dans ces conditions, il suffirait juste quun mot polylexical soit prsent dans le dictionnaire pour devenir une lexie. En ce qui concerne le statut et les limites des locutions verbales traduites par des verbes monolexicaux, nous rencontrons un autre problme : comment dterminer le degr de figement dune locution verbale ? Au-del des critres de dtermination du degr de figement des expressions polylexicales (opacit smantique23, blocage des proprits transformationnelles24, non-actualisation des lments25), Gaston Gross (GROSS 1996 :9-23) prcise le statut des locutions par comparaison de leurs proprits avec celles des termes monolexicaux :
Quand on examine les listes de squences contraintes labores au LADL et au LLI26, on constate que les suites totalement figes sont trs minoritaires par rapport celles qui ont des restrictions partielles. On peut dabord se demander si les suites totalement figes doivent tre assimiles aux catgories simples. Cordon(-)bleu est-ce un nom ? Casser sa pipe est-ce un verbe ? La rponse nest pas simple. Du point de vue syntaxique, ces suites ont le mme fonctionnement que les catgories simples correspondantes. Cordon bleu peut avoir la mme distribution que (bonne) cuisinire : () Cependant, on ne peut pas assimiler le nom compos une catgorie simple, pour des raisons de nature diverse. Comme il y a deux mots diffrents, la mise au pluriel exige deux marques (des cordons bleus) et le traitement informatique se trouve de plus confront des difficults spcifiques. Comme il y a un sparateur entre les deux mots, il faut informer le systme que ces deux mots ne forment en fait qune seule unit fonctionnelle et, dans une perspective de gnration automatique, que les relations habituelles entre un substantif et ladjectif qui laccompagne sont bloques. Des rflexions analogues peuvent tre faites propos de casser (sa) pipe. La distribution est celle dun verbe : Paul est mort dans un accident de voiture
Lopacit smantique intervient lorsque la lecture dun nonc nest pas compositionnelle. 24 Le blocage des proprits transformationnelles dsigne pour une locution limpossibilit de lui appliquer les processus de transformations des noncs simples tels que la passivation, la pronominalisation, etc. 25 Gross prcise que lon peut parler de locution lorsque aucun des lments lexicaux qui la composent ne peut tre actualis. 26 Respectivement : Laboratoire dAnalyse Documentaire et Linguistique de lUniversit Paris 7 et Laboratoire de Linguistique Informatique de Paris 13.
58
23

Paul a cass sa pipe dans un accident de voiture. Mais on ne peut pas considrer casser (sa) pipe comme un verbe simple. La premire raison, commune celle des noms composs, est la polylexicalit et, par consquent, la prsence de sparateurs, dont le blanc, et les problmes de traitement informatique induits. Il y a ensuite le fait que la squence comporte une variable : le possessif est corfrent au sujet et varie de ce fait. Enfin, il y a des insertions possibles dans la squence, ce qui nest jamais le cas dun verbe simple. On peut, en effet, insrer certains adverbes ou incises : Fais attention, sinon tu vas vraiment casser ta pipe. Si on identifiait la squence casser (sa) pipe un verbe simple, alors on gnrerait incorrectement la ngation : Paul ne meurt pas *Paul ne casse sa pipe pas Paul ne casse pas sa pipe. Une locution nest donc pas une catgorie primaire. Elle se sert de catgories primaires qui, dpourvues dactualisation, se combinent pour former des units polylexicales qui ont le mme statut syntaxique que les catgories simples. () Les locutions sont donc des units intermdiaires entre les catgories simples dont elles ont les fonctions syntaxiques et les syntagmes dont elles ont perdu lactualisation. GROSS (1996 : 22-23)

Observons tout dabord le problme par la diffrence entre caractristiques smantiques et syntaxiques. En termes de construction syntaxique, une locution verbale nest pas un verbe, elle est constitue de plusieurs mots, dont un verbe recteur et plusieurs mots dautres catgories grammaticales (ou parfois contenant un autre verbe subordonn au premier), et elle ne respecte pas strictement les mmes contraintes syntaxiques que le verbe seul. Gaston Gross pose le problme de la locution verbale dun point de vue informatique. Smantiquement parlant, une locution est opaque dans le sens o son interprtation ne peut tre rduite celle de ses parties. Ainsi casser sa pipe nest pas rductible laddition dun des sens de casser une acception de pipe. Certes, ce point de vue nexclut pas que la syntaxe dune locution verbale prsente quelques diffrences avec les verbes monolexicaux, la ngation en tant lexemple le plus vident, bien quil nous semble discutable : la ngation est douteuse dans lexemple invoqu par G. Gross autant que dans dautres auxquels nous avons pens : 15) ?? Pierre ne casse pas sa pipe 16) ? Pierre na pas cass sa pipe 17) ?? Vous nallez pas voir de quel bois je me chauffe Selon nous, ces exemples sont tellement opaques quils ne paraissent plus autoriser la ngation, au risque den affecter le contenu smantique et aspectuel (ce
59

dernier point est important, la ngation semblant mieux marcher au pass dans (16) par rapport lexemple (15) que nous trouvons plus que discutable). Pour rsumer, une locution verbale est une expression polylexicale dont la tte syntaxique est un verbe, forte opacit smantique et au fonctionnement syntaxique globalement quivalent celui des verbes monolexicaux. Consquemment, une locution verbale peut tre considre comme un terme part entire, auquel nous affecterons une tiquette catgorielle diffrente des verbes habituels. De cette faon, nous esprons associer cette catgorie complexe les caractristiques syntaxiques quelle ne partage pas avec la catgorie simple. Dans nos bases de donnes, une locution ou une priphrase27 polylexicale constitue une lexie partir du moment o elle est propose comme traduction ou si elle est elle-mme traduite dans le dictionnaire. Bien entendu, la sous-reprsentation de ces expressions dans le dictionnaire pose problme. En dfinitive, toutes les expressions polylexicales posent des problmes de typologie et de description. La forme de nos bases de donnes devra concilier la grande varit des types de ces expressions tout en simplifiant au maximum leurs conditions dapparition.

3. Le verbe au centre de l'tude


Aprs avoir pass en revue les principales notions de smantique lexicale que nous avons manipules, savoir la polysmie, la synonymie et les lexies, nous allons prsent nous intresser la catgorie grammaticale qui est au centre de nos proccupations : le verbe. Nous allons en premier lieu proposer une dfinition aussi large et prcise que possible de ce quest un verbe afin de prciser les limites de ltude et de justifier notre choix de traiter les verbes plutt que toute autre catgorie. la suite de cela, nous prsenterons brivement un certain nombre de travaux ayant trait aux verbes qui nous ont inspir peu ou prou pour les analyses dcrites par la suite. La richesse des informations et des analyses potentielles partir des prdicats verbaux sera illustre par divers aspects dont les caractristiques aspectuelles ou les structures argumentales induites par le verbe.

3.1 Dfinition
Si tout francophone est capable de reconnatre un verbe dans un nonc, dfinir ce quest prcisment un verbe nest pas aussi simple. Touratier (1996) met en vidence les contradictions et les approximations inhrentes aux dfinitions de la classe grammaticale des verbes proposes dans les grammaires, de Aristote la fin du vingtime sicle.
27

Une priphrase verbale est un type de locution qui vhicule des informations souvent aspectuelles et qui jouent un rle de pseudo-auxiliaire dun autre verbe.
60

Tout dabord, les grammairiens ont de tout temps prsent le verbe comme un mot susceptible de varier morphologiquement en fonction de la personne, du temps, du mode, etc. et donc dappartenir un paradigme de conjugaison. On retrouve dj cette dfinition chez le grammairien grec Denys le Thrace, puis chez Lyons (1970), Bonnard (1976) ou Grvisse-Goosse (1993). Selon Touratier, cette dfinition est contestable dans la mesure o toutes les langues ne possdent pas de morphologie du verbe permettant de distinguer celui-ci des autres catgories grammaticales (comme en chinois et en indonsien, par exemple). Certes, le phnomne de conjugaison est commun toutes les langues indoeuropennes mais cela ne suffit pas non plus en arrter la dfinition pour cette famille de langues, car les auxiliaires sont les lments porteurs des morphmes de conjugaison dans les constructions temps composs. Ces auxiliaires, modaux ou non, posent un problme de dfinition autonome (peuvent-ils tre considrs comme des verbes ?) autant que de dfinition syntaxique du verbe en gnral (si cest lauxiliaire qui prend les morphmes de conjugaison, que sont les mots qui suivent et que lon met au participe pass ?). Pour dpasser cet cueil, certains auteurs proposent une dfinition smantique de la classe verbale, commencer par Aristote et Gustave Guillaume, lesquels prsentent la spcificit du verbe en tant qulment sous-tendu de temps (Guillaume, 1965), qui implique et explique le temps (id, 1964) ou qui ajoute sa propre signification celle du temps (Aristote, in Tricot, 1994). Comme lexplique Touratier, cela ne permet pas non plus une caractrisation du verbe puisque dautres morphmes et dautres lments non verbaux peuvent galement impliquer, expliquer et porter le temps dans les langues considres. Il ne sagit pas par consquent dune caractristique spcifique de la catgorie verbale. Puisque le verbe nest pas seul vhiculer du temps dans le discours, il faut en chercher la dfinition smantique un autre niveau. La premire tre apparue correspond ce quon trouve ordinairement dans les grammaires scolaires, comme le prcise Touratier :
() mettant en avant la seconde partie de la dfinition de Denys de Thrace, elles prtendent que le verbe exprime une action faite ou subie par le sujet. vrai dire, elles sont gnralement obliges dallonger la liste des significations du verbe, en disant par exemple :
Le verbe est un mot de forme variable, qui exprime une action faite ou subie par le sujet, ou qui indique un tat du sujet. (J. Dubois, G. Jouannon, R. Lagane, Grammaire franaise, 1961, Paris Larousse, p.76, 148.) ()

(Touratier, 1996 :7)

61

Meillet, puis Grevisse et bien dautres, donne cette spcificit suppose du verbe le terme synthtique de procs mais celui-ci nest pas pour autant propre aux verbes car, comme le souligne Jean Fourquet, un nom ou adjectif peuvent tout autant tre dsigns par le terme de procs de nombreux cas, par exemple pour bombardement [qui] voque la mme reprsentation que ils bombardent (Fourquet, 1950, p.76). Cette solution smantique nest donc pas non plus la bonne pour caractriser le verbe. Dans Laventure des langues en Occident (1994), Henriette Walter note avec un certain humour que si les Allemands semblent tre des gens trs polis qui ne se coupent jamais la parole, cest probablement parce que le verbe est habituellement en fin de phrase dans leur langue. Bien que prsentant ce point de vue sous forme de boutade, Henriette Walter met tout de mme en avant limportance smantique du verbe dans la langue, comme si lattente dun lment spcifique dnotant le procs tait indispensable pour linterprtation des noncs. En dfinitive, la meilleure dfinition pour une classe verbale universelle semble tre celle qui dsigne le verbe comme tant simplement ce qui a vocation tre le constituant ou le noyau central du constituant de lnonc qui remplit la fonction informative de rhme (Touratier, 1996 :9). Lauteur ajoute que cela en fait le point dancrage privilgi des indices de temps et des indices daspect (Fourquet, 1950 :78), ce qui explique quil est affect de ce quon appelle une conjugaison dans de trs nombreuses langues. cette dfinition, nous souhaiterions ajouter que si le verbe est la fois le rhme (ou le noyau de rhme), le sige privilgi du temps et de laspect (mais pas exclusivement) et le porteur dune marque de conjugaison (au moins dans les langues qui nous proccupent), alors il faut considrer le prdicat verbal dans son ensemble et pas seulement son noyau lexical. En effet, les auxiliaires participiaux ou modaux et les priphrases aspectuelles sont porteurs, lorsquils sont prsents, de certains indices temporels et aspectuels ainsi que des marques de conjugaison en question. Autrement dit, le verbe est lensemble de la construction verbale, cest--dire le verbe lui-mme plus ses auxiliaires. Pour aller encore plus loin dans la dfinition avec laide de ce que disait Jean Fourquet au sujet du procs, nous nous demanderons si absence de verbe signifie vraiment absence de verbe ? Autrement dit, un nonc sans verbe est-il forcment dpourvu de procs ou de noyau rhmatique central ? Citons dabord le cas de lellipse du verbe. Dans certaines situations, comme les rponses communicatives, rien noblige ce que le verbe exprim dans la premire phrase de la communication soit systmatiquement rpt dans toutes les phrases de tous les locuteurs, par exemple : 18) Quest-ce quon mange ce soir ? Du poulet.
62

Du poulet ? Oui, du poulet. NDSH : [= (On mange) du poulet] Ce que ces occurrences ont de particulier est que le verbe non exprim ne remplit manifestement plus la fonction informative de rhme, celle-ci tant occupe dans la deuxime phrase par lobjet du poulet. Cest sur la base de cette notion de rhme que la grammaire gnrative considre que les noncs construits sur cette forme elliptique ne constituent pas des phrases. partir de ces considrations sur labsence du verbe , nous constatons que les cas apparents de thmatisation du verbe sont caractriss par lellipse, la rptition, la paraphrase (ce qui revient presque au mme) ou par lemploi dun dverbal, que nous allons dfinir. Dans un autre ordre dides, nous rapprocherons les verbes et les substantifs dverbaux : cest--dire les substantifs comme lments prdicatifs non verbaux issus de verbes. Les dverbaux sont des cas de nominalisation du prdicat dans des constructions non verbales ou verbes supports. Contrairement aux formes elliptiques, les dverbaux peuvent parfaitement remplir la fonction de rhme, et surtout celle de procs, et ainsi remplacer le verbe dans son expression smantique habituelle. Lexemple de bombardement propos par Fourquet que nous citons plus haut illustre bien le phnomne dappropriation du procs par un lment non verbal. Dans les travaux linguistiques plus approfondis que nous ferons avec traverser et les verbes de parole, nous avons mentionn la possibilit pour un prdicat de se fonder sur une occurrence nominale (traverse, discussion, conversation et de nombreux autres avec un verbe support effectuer, faire, avoir, etc.) sans avoir approfondi la question faute de temps.

3.2 Pourquoi les verbes ?


Dans sa dfinition mme, nous trouvons une justification forte au fait que nous nous intressons davantage aux verbes quaux autres catgories grammaticales. Avant toute chose, le verbe est llment pivot essentiel des phrases bien formes, y compris lorsquil est absent, comme nous lavons voqu au sujet de lellipse et des dverbaux. Cest galement le seul lment lexical sens plein qui chappe gnralement aux chanes rfrentielles et anaphoriques28 ainsi qu la thmatisation.

28

Hormis dans certains cas danaphores associatives dclencheur verbal ( il coupa du pain et rangea le couteau ) ou verbe vicaire ( on nagit point comme vous le faites ), selon le terme propos par Riegel, Pellat & Rioul (1996). Pour les premires, le rfrent est chercher dans la structure argumentale du verbe, couteau tant linstrument habituel de laction de couper.
63

De mme, il ne sagit pas dun dictique pur car il ne possde pas de rfrent dans la situation dnonciation, contrairement ses arguments. Ensuite, et surtout, lanalyse du verbe ne fait pas lconomie de ltude de tous les lments qui lentourent. Nous allons largement insister sur le rle du co-texte immdiat du verbe, et notamment sur limportance de ses arguments, dans le processus de dsambigusation de celui-ci. En tudiant de prs un verbe comme traverser, nous nous apercevons galement que la saturation de tous les traits smantiques qui lui sont lis est tributaire dun co-texte large qui dpasse souvent le cadre de la prdication. Cest en raison du rayonnement tout particulier des lments de la catgorie verbale, et aussi en raison de sa forte dpendance envers ses arguments et le co-texte, que nous avons entrepris den faire le matriau de base de toutes nos recherches doctorales.

3.3 La classification des verbes en linguistique


Sous ce titre, nous nallons pas exposer, loin sen faut, la totalit des travaux effectus sur les verbes en linguistique car le nombre et la varit de ces tudes dpassent de trs loin ce que nous sommes capable de connatre. Dans les paragraphes suivants, il ne sera pas question dtudes morphologiques, large domaine que nous navons pas explor, ni de travaux syntaxiques ou smantiques portant sur des verbes prcis, hormis dans les chapitres II et III o nous ferons rfrence aux recherches et publications dont nous avons eu connaissance au sujet des verbes que nous avons tudi, traverser et les verbes de parole en particulier. Tout dabord, nous pouvons citer deux classifications majeures, celles de Maurice Gross pour les verbes franais (et les tableaux pour la traduction qui sen sont ensuivis) et celle de Beth Levin pour un grand nombre de verbes anglais rpartis en de nombreuses catgories : Les tables de Maurice GROSS. Le travail de classification des verbes effectu par Maurice GROSS est probablement ce jour le plus riche et le plus complet en ce qui concerne le franais. Dabord dvolue la description de toutes les formes syntaxico-smantiques possibles29

Des travaux dj largement dcrits dans son ouvrage de 1975, Mthodes en syntaxe. Le rgime des compltives, dans lequel Maurice Gross prcise les constructions de nombreux verbes avant den proposer une classification en fonction de critres syntaxiques. Cette somme de donnes considrable servira ensuite de socle ses recherches en traduction automatique fondes essentiellement sur des dictionnaires et des bases de donnes trs fournies. Dans une moindre mesure, nos propres travaux sapparentent aux siens en cela quils se fondent sur une base de donnes dtaille et directement exploitable.
64

29

(constructions, types de complment, etc.), luvre de Gross sest oriente vers la traduction automatique. Les catgories de Beth LEVIN. Beth Levin a recens 3000 verbes parmi la totalit des verbes anglais en les classant et les regroupant en fonction de leurs caractristiques syntaxiques et de leurs proprits smantiques. Chaque verbe peut appartenir plusieurs classes en mme temps, en fonction de ses acceptions ou de ses constructions. Ce travail considrable a deux intrts immdiats : chaque verbe parmi les verbes anglais les plus frquents est compar aux autres verbes qui partagent avec lui les mmes caractristiques argumentales et smantiques ; dautre part, Beth Levin propose une bibliographie trs riche rpartie entre chacune des classes quelle prsente. Toutefois, nous regrettons dans ses travaux labsence des verbes particule fusionne ou dtache, Levin rduisant la classe des verbes tudis lensemble des units monolexicales. Ce parti pris limite normment la vision dun lexique anglais volutif dans lequel les prpositions jouent un rle important et subtil dans la cration de sens nouveaux ou dans la nuance des sens du verbe dorigine. Au-del des considrations lexicales et smantiques portant sur le lexme verbal, un courant majeur de la linguistique a mis en exergue la capacit des verbes exprimer un sens aspectuel , cest--dire une ou des temporalit(s) spcifique(s) non explicite(s) au moyen des dsinences de conjugaison. Ces dernires sont habituellement perues comme porteuses du temps de la phrase mais ne rendent pas ncessairement compte du temps rel ou profond, lequel est connu sous le nom daspect. A ce sujet, nous notons que laspect dans un nonc peut rsulter de la combinaison de plusieurs facteurs propres ou externes au verbe, et que le sens aspectuel ne se rapporte pas seulement au temps stricto sensu, cest--dire la distinction formelle entre pass, prsent et futur. Nous prsentons des considrations gnrales sur laspect au dbut du chapitre III, lequel sera presque entirement consacr la reconnaissance des proprits aspectuelles des occurrences contenant le verbe traverser ainsi quau rapport existant entre ces proprits et le smantisme du verbe. Cest pourquoi nous nentrerons pas ici dans le dtail des travaux effectus sur cette notion.

3.4 La polysmie verbale


La polysmie verbale est une polysmie gomtrie variable, et ce pour plusieurs raisons. Tout dabord, il sagit de bien montrer la diffrence entre les emplois premiers du verbe et ses emplois mtaphoriques, lesquels dcoulent des premiers. Selon le
65

principe de lexicalisation, les sens dabord mtaphoriques dun verbe ont tendance perdre leur caractre figur pour devenir peu peu des sens propres susceptibles dtre mtaphoriss leur tour. En ce sens, les verbes sont plus que la plupart des units des autres classes grammaticales soumises la polysmie en tant que processus de cration lexicale et pourtant ou prcisment cause de cela elle a t trs peu tudie par rapport aux polysmies nominale, adjectivale voire prpositionnelle. Ensuite, on ne peut pas parler de polysmie verbale au sens large sans mentionner le rle des collocations dans la caractrisation de la polysmie. Nos analyses contrastives montrent que le sens de certains verbes est avant tout une question de reconnaissance de la structure argumentale, et quune seule acception est susceptible de ses subdiviser en acceptions plus fines en fonction du sujet et des complments qui laccompagnent. Mme si dans le fond le sens est le mme, on constate des nuances par le jeu du transfert interlangue. Il est en ainsi pour abandonner comme nous lavons dj relev au cours de ce chapitre. Pour la visibilit de la polysmie verbale au moyen des graphes, notons nouveau les travaux effectus par Bruno Gaume, Karine Duvignau, Sabine Ploux, Jacques Franois et quelques autres. Pour lessentiel, ces chercheurs russissent caractriser la polysmie des verbes en se fondant sur les calculs automatiques de la synonymie et/ou de la distance lexicographique. Les rsultats quils observent en se fondant sur lautomatisation des donnes sont gnralement proches de la ralit du lexique telle que nous le percevons tous. Mais dans tous les cas, la dmarche est avant tout mathmatique et stochastique.

3.5 Transition
Aprs avoir pos les notions et concepts dont ces travaux sont tributaires, nous allons prsent dcrire succinctement quelques recherches majeures dans le domaine de la smantique lexicale, et plus particulirement les travaux qui ont trait la description et la modlisation du lexique et de la polysmie. Ceux qui nous ont le plus inspir et dont nous allons parler maintenant sont les modles de traduction selon Jacques Franois (par la prise en compte de critres situationnels prcis), les graphes conceptuels de John Sowa, les dictionnaires lectroniques des synonymes du CRISCO et de lISC Lyon, le Dictionnaire Intgral de Dominique Dutoit, le Lexique Gnratif de James Pustejovsky, le DEC de Meluk et ses collaborateurs sans oublier les classes objets dveloppes par lquipe de Gaston Gross.

66

4. Modles thoriques 4.1 Modles de traduction selon J. Franois


Largement prsents dans Changement, Causation, Action , les modles de traduction de Jacques Franois (tirs de son multilexique contrastif ) illustrent une reprsentation du sens partir de la description langagire la plus fine possible pour le passage du franais vers lallemand. Il adopte une dmarche onomasiologique pour la structuration de champs smantiques. premire vue, notre propre dmarche est purement smasiologique car nous ntudions demble que la polysmie par allers et retours successifs lintrieur des dictionnaires. Toutefois, il est manifeste que nous avons voulu nous rapprocher dune dmarche onomasiologique par la prise en compte des liens de synonymie gnraliss dune part et par la constitution de graphes multilingues dautre part. De ce point de vue, les travaux de Jacques Franois ont une forte rsonance au travers des ntres. La banque dquivalences laquelle il participait dans le cadre dEUROTRA dans les annes 80 est galement semblable celle que nous avons produite pour notre recherche. Pour en revenir au multilexique, une prise en compte aussi fine et absolue des variations contextuelles nest que rarement conforme lusage, dans le cadre du discours rapport. Sans la connaissance extrinsque de la situation dnonciation, il nest srement pas possible de rassembler ces informations par ltude du co-texte seul. Il sagit donc avant tout de modles descriptifs, sous la forme dun formalisme trs prcis. Jacques Franois dcrit le langage partir des critres situationnels les plus fins. Cest le langage tendu la connaissance du monde nonciatif dont voici un exemple avec le verbe touffer et lun de ses quivalents en allemand :
TOUFFER, 1 touff- [ N:x2anim avec V N:x1anim ]
patient

caus/agent____v

a: +Dyn, +Agent, +Trans (+Cause), +Tel, (-CentreTel), -Period /2/ b: RespLibre Db-T (TYPIQUE) , Resp0 Fin-T /E/ c: mthode : x2 empche les voies respiratoires de x1 de rester en contact avec un mlange gazeux propre la respiration /3/ Franois (1989:470)

Lavantage de la mthode est quelle met en valeur limportance des variations contextuelles et aspectuelles pour la traduction. Chaque lexie est code par Jacques Franois avec toutes les valeurs aspectuelles et smantiques quil juge utile pour slectionner le juste correspondant en langue cible, en loccurrence le verbe allemand ersticken dans le cas que nous citons, lequel verbe a galement t encod dans sa base de la mme manire que le verbe franais touffer.
67

Dans la mesure du possible, nous avons le mme degr dexigence dans la lecture des dictionnaires dans le but dextraire les donnes qui enrichissent notre base. Cette exigence est primordiale dans loptique de rassembler toutes les informations ncessaires pour le transfert et, au-del, pour la discrimination de tous les candidats dun mme terme. Bien sr, le travail de Jacques Franois va beaucoup plus loin par la modlisation de toutes les donnes aspectuelles, ce quun dictionnaire dusage courant ne peut pas faire de manire explicite. Mais la connaissance fine de laspect revt une telle importance que nous en ferons une tude complte pour un verbe qui en joue normment : traverser, au chapitre III.

4.2 Graphes lexicaux, graphes conceptuels 4.2.1 La gense et la cration des formalisations du langage et des graphes conceptuels : dAristote John Sowa
Les relations entre concepts et les ontologies ont retenu lattention de nombreux philosophes et linguistes depuis lAntiquit. Le premier avoir labor des semblants de rseaux conceptuels fut Aristote. Beaucoup plus tard, au dix-septime sicle, Leibniz imagina un systme de combinaison mathmatique qui donnait un assemblage de concepts un nouvel indice par le produit des indices des deux prcdents30, le considrant comme un nouveau concept. Plus prs de nous, au vingtime sicle, un certain nombre de scientifiques, au demeurant plus souvent mathmaticiens que linguistes, ont labor des formalismes susceptibles de rendre compte par la logique formelle la complexit du langage. John Sowa fut un des pionniers de la reprsentation du lexique et du langage sous la forme de graphes dits conceptuels. Mathmaticien dorigine, son postulat tait que la langue tait formalisable par le biais de la thorie des graphes et que les liens conceptuels ntaient ni plus ni moins que des liens entre les sommets dun graphe. Dans son article de 1992, Logical Structures in the Lexicon , John Sowa propose une lecture critique de certains formalismes qui ont prcd le sien, commencer par celui de Leibniz puis en poursuivant avec une rflexion sur le feature-based system de Katz et Fodor (1963) :
In their feature-based system, Katz and Fodor (1963) factored the meaning of a word into a string of features and an undigested lump called a distinguisher. Following is their representation for one sense of bachelor: bachelor noun (Animal) (Male) (Young) [ fur seal when without a mate during the breeding time].
30

If rational were represented by 2 and animal by 3, then their product 6 would represent rational animal or human. (), (Sowa, 1992 :39). Sowa prcise que Leibniz essaya dappliquer son systme la mcanisation des syllogismes dAristote, mais avec un succs mitig.
68

() Sowa (1992:40)

Dans cet exemple, bachelor est pourvu dun marqueur syntaxique (noun) et de divers traits smantiques (Animal, Male et Young) qui sont des classes smantiques dont la combinaison est cense caractriser lentre principale. La phrase entre crochets, le fameux distinguisher31, est la glose destine rendre compte du sens vritable du terme tudi. Malgr les nombreuses critiques essuys par Katz et Fodor, notamment propos de leur refus de voir derrire les traits smantiques lexistence de primitives ou de structures profondes qui caractriseraient beaucoup mieux la pertinence de leurs modles, Sowa tempre quelque peu la fronde en indiquant que les traits ne sont pas pour autant inutiles dans la reprsentation du sens mais quils ne peuvent exclure une ralit du sens plus profonde :
() These criticisms do not imply that features are useless. But they indicate that features are derived from some deeper, more fundamental representation. Sowa (1992:40)

Sowa relve galement certaines insuffisances dans les modles proposs par Montague et Schank. Selon lui, leur principale faiblesse est de ne pas profiter des forces des autres : Montague a labor un formalisme efficace mais particulirement rigide tandis que celui de Schank est attractif en raison de sa plus grande flexibilit qui le rapproche plus de la ralit de la langue, ce qui constitue galement son plus grand dfaut puisque les modles quil prconise sont instables et peu rutilisables dune personne lautre, comme Sowa le souligne propos des tudiants de Schank. Le premier est plus efficace pour une analyse exhaustive dun point linguistique prcis et ponctuel tandis que le second peut embrasser plus largement mais de manire moins nette des emplois varis dune mme expression. En dfinitive, John Sowa entend essayer de garder le meilleur des deux, sans omettre la thorie des traits initie par Katz et Fodor, afin de concevoir un formalisme qui allie rigueur et flexibilit, reconnaissance des traits et prise en compte des reprsentations profondes comme les liens conceptuels, les cadres temporels et dautres types de relations smantiques qui participent du sens lexical. Le background de ses graphes conceptuels est bien meilleur car cest de la rigueur de ses modles que peut jaillir la mallabilit du langage, comme en tmoigne sa reprsentation du Prix

31

Sowa semble ne pas beaucoup apprcier le distinguisher quil qualifie d indigested lump , littralement (gros) morceau non digr avant de prciser que Katz et Fodor ne lanalysent pas. La question sous-jacente son sujet est donc quoi sert-il ?
69

Goncourt (1992 :50) qui met en avant le mcanisme de mtonymie comme processus de cration polysmique :
Figure 1 : Graphe de Prix Goncourt par John Sowa (1992)

Dans ce graphe, Sowa fait co-habiter des traits avec des relations smantiques qui les relient, des cadres temporels qui permettent une lecture rcursive de lensemble ou de certaines parties du graphe : Certaines oprations reprsentes dans le graphe peuvent se rpter certains moments du temps, luvre qui gagnera le prix est antrieure au moment o le prix est dcern (cadre PAST), le prix est dcern chaque anne (cadre principal) et linstitution se situe en dehors de ces deux sous-cadres car il possde une dimension intemporelle . En lillustrant par les processus mtonymiques qui autorisent la polysmie sousjacente de Prix Goncourt, lobjectif avou de John Sowa est de parvenir une reprsentation exhaustive des relations et des sens lexicaux au sein dun graphe unique. Son ambition assume est que tout ce qui participe la construction du sens doit tre formalisable et quil parviendra lui-mme la formaliser au sein de ses graphes conceptuels. Mme si lentreprise est louable et ses travaux fort convaincants, il est fort probable quil ny parviendra jamais.
70

4.2.2 Les dictionnaires de synonymes modliss


4.2.2.1 Les ralisations de lELSAP et du CRISCO32 Dans leur cahier du CRISCO n17 de juillet 2004, les membres de lquipe prsentent leur dictionnaire lectronique des synonymes :
le dictionnaire des synonymes du CRISCO (http://www.crisco.unicaen.fr/) est dun genre particulier ; cest en effet lun des deux dictionnaires des synonymes du franais en accs libre sur Internet33 ; il contient 49000 entres, chacune suivie de ses synonymes, comme par exemple : dmarcation:distinction,dlimitation,frontire,ligne,limitation,limite,lisire,m arque,sparation Chaque synonyme est lui-mme une entre, de sorte que lon peut considrer notre dictionnaire comme un ensemble de 49000 mots-vedettes (entres) relis les uns aux autres par un rseau de relations. Il y a relation lorsque les deux vedettes sont synonymes, et lon dnombre un peu plus de 199000 relations pour tout le dictionnaire. Ces relations de synonymie proviennent de sept dictionnaires classiques : deux dictionnaires analogiques (le Grand Larousse et le Grand Robert), deux dictionnaires des synonymes du 19me sicle (Lafaye et Guizot), et trois dictionnaires du milieu du 20me sicle (Bailly, Bnac et Du Chazaud). Toutes les informations contenues dans ces dictionnaires nous ont t fournies sous forme de fichiers informatiques par lINALF34 ; le travail effectu au laboratoire a consist harmoniser les mots-vedettes de ces sept fichiers, puis fusionner toutes ces donnes. () Manguin, Franois et alii (2004 :1-2)

De la mme faon que Jean-Luc Manguin, Jacques Franois et leurs collaborateurs, notre propre mode dextraction et de reprsentation des donnes sappuie sur une fusion des dictionnaires ou des diffrentes parties dun mme
32

CRISCO = Centre de Recherches Inter-langues sur la Signification en COntexte, UMR de lUniversit de Caen et du CNRS. LELSAP est lancienne quipe de recherche en linguistique de luniversit de Caen, remplace depuis par le CRISCO. Cest dans le cadre dune collaboration entre lELSAP et lINALF que Sabine Ploux, Bernard Victorri et Catherine Fuchs ont initi les travaux dinformatisation des dictionnaires de synonymes. 33 Les auteurs prcisent que lautre dictionnaire des synonymes disponible est celui de lISC que nous dcrivons dans le paragraphe suivant. 34 ce titre, les auteurs prcisent quoutre les donnes des sept dictionnaires mentionns, leur regroupement de liens synonymiques contient un ensemble important de corrections et dajouts (CRISCO, 2004 :2).
71

dictionnaire lorsquil sagit douvrages bilingues. Certes, il en rsulte en apparence une perte dinformations :
la fusion des dictionnaires a fait disparatre les commentaires (quand ils existaient) et la structure des ouvrages dorigine ; cet appauvrissement apparent, ncessaire en raison des disparits entre les diffrents dictionnaires de dpart, constitue en fait un tremplin pour des mthodes automatiques qui, comme nous le verrons, permettent danalyser de manire fine et objective lespace smantique des mots. ibid. (p.2)

Notre mthodologie personnelle et nos conclusions sont donc trs proches de celles des membres de cette quipe. Toutefois, nous avons toujours essay, dans la mesure du possible, de conserver les commentaires qui accompagnent ventuellement un parcours de traduction dans les dictionnaires bilingues, en partant du principe quun commentaire est souvent un critre discriminant indispensable ou tout le moins lexplicitation dun critre discriminant ncessaire. 4.2.2.2 Autre volet du projet lISC Lyon35 : les graphes multilingues Les dictionnaires de synonymes modliss auxquels nous nous rfrons sont les champs lexicaux labors partir des fichiers informatiques des synonymes raliss lINALF et mis en graphiques lELSAP et au CRISCO puis bilingualiss par Sabine Ploux et Hyungsuk Ji, lesquels sont en train de dvelopper leurs modles en espagnol en attendant dy intgrer dautres langues. Notre vision de la co-reprsentation multilingue est un peu dans le mme esprit. Tout ici repose sur le principe de proximit smantique par synonymie (calcul partir de la synonymie issue de donnes lexicographiques croises). Le principe est premire vue le mme que pour Wordnet Multilingue mais lopacit de ce dernier ne permet pas den tre certain. Mais surtout, les relations de synonymie au sein des dictionnaires subit un traitement de symtrisation :
Dans les dictionnaires initiaux, la relation de synonymie nest pas toujours atteste symtrique : un terme peut tre synonyme dune vedette sans que la rciproque soit vraie. Pour symtriser cette relation, le programme cherche, pour une vedette donne, tous les articles contenant cette entre en partie gauche et ajoute les vedettes de ces articles la liste des synonymes, quand elles ny figurent pas dj. Ploux (1997:5)

Cest peu de choses prs la mme mthodologie que nous avons utilise pour la cration des Lexiques Inverss partir des dictionnaires bilingues. Dans le chapitre
35

ISC Lyon = Institut des Sciences Cognitives de Lyon.


72

IV qui traite de lalgorithme de transformation des dictionnaires, nous discuterons de la question de la symtrisation dans une perspective beaucoup plus critique et dans le souci dadapter nos outils aux langues et non pas le contraire. En ce qui concerne la synonymie intra-langue, nous admettons plus facilement le rtablissement dune symtrie qui parat tre la base de la dfinition de la synonymie. Le problme des patates (nom usuel des graphiques), cest quil nexiste pas despace autonome pour les units lexicales tudies. Chaque espace du graphe est occup par le mot slectionn, un ou plusieurs synonymes (gnralement plusieurs) ainsi quune ou plusieurs traductions (gnralement plusieurs) en anglais ou en franais selon la langue dorigine. A chaque portion du graphe informations constantes correspond une clique , et inversement. Une clique est lorigine un ensemble de synonymes qui sont rputs interchangeables dans un contexte donn (cf. dfinition de la synonymie). Elles sont calcules automatiquement par un algorithme de dtection de la distance lexicographique partir de la fusion des dictionnaires de synonymes fusionns que nous avons dcrite prcdemment. De mme, la prolifration des units lexicales dans une mme clique ne permet pas de dterminer quelles sont les relations privilgies entre elles deux par deux. En admettant que ces dernires puissent tre calcules automatiquement (avec des outils semblables ceux qui ont permis de construire les graphes), rien ne les valide demble. Il est noter que les graphes bilingues raliss par Ploux et Ji (Ploux & Ji, 2003) sont le rsultat de la mise en relation de deux dictionnaires monolingues de synonymes, un franais et un anglais, et dun dictionnaire bilingue franais-anglais. Lautomatisation de cette fusion sous la forme dun graphe appel atlas smantique conduit au mme mode de reprsentation que le graphe monolingue dorigine. La diffrence majeure et lapport considrable par rapport celui-ci sont qu chaque espace du graphe sont associes toutes les traductions potentielles de litem considr dans des emplois bien dlimits. Les mmes auteurs vont encore plus loin en incluant dans leurs modles ce quils appellent des contextonymes , cest--dire des termes qui sont smantiquement corrls aux items viss. Ces contextonymes sont intgrs un espace smantique multidimensionnel. Selon eux, la prise en compte de ces termes aide la comprhension des textes ainsi quau reprage des connotations et des sens contextuels pour des units polysmiques (Ji, Ploux & Wehrli, 2003). Cest dans un mme esprit que nous avons souhait tudier certains verbes dans leur environnement langagier, notamment traverser, pour montrer ce que les dictionnaires ne peuvent pas rvler de manire exhaustive quant au sens des verbes.

73

4.2.3 Le Dictionnaire Intgral (DI, MEMODATA)36 de Dominique Dutoit ou le Petit Robert en rseau
Le DI labor par Dominique Dutoit Caen, au sein de lentreprise MEMODATA, est sans doute lun des travaux lexicologiques informatiss les plus aboutis en terme de volume et du nombre de liens implants. Nous allons lui consacrer un sous-chapitre consquent, en raison du fait quil sagit probablement du travail le plus proche de nos aspirations et de nos rsultats tangibles. Dautre part, nous avons eu lopportunit davoir accs aussi bien loutil qu son mode de fonctionnement interne. Dans la perspective deffectuer un travail densemble sur les lexiques multilingues en vitant lcueil de la terminologie, il nous parat intressant voire indispensable de se pencher sur les potentialits des rseaux smantiques. En partant du principe que la traduction automatique impose la prise en compte des travaux textesens et senstexte, lutilisation dun rseau smantique conu pour permettre la comprhension aussi bien que la gnration nous semble judicieuse, la condition de disposer dun outil construit dj implant. Dans les paragraphes suivants, nous prsenterons les caractristiques du Dictionnaire Intgral labor par Dominique Dutoit Caen ainsi que la faon dont nous aurions souhait lexploiter. Nous prsenterons sparment le Dictionnaire Intgral, lalgorithme qui exploite les donnes de ce dernier ainsi que les outils activs par cet algorithme. Pour chacune des trois parties, nous proposons un diagnostic sommaire et quelques remarques critiques pour tayer notre point de vue. En guise de conclusion, nous donnerons notre vision personnelle au sujet de lintrt que reprsente lapport de ce type de rseaux smantiques dans le domaine de lindustrie de la langue. Nous tenterons galement dexposer notre vision de loutil pour son exploitation en traduction automatique ou semi-automatique (TAO37). Ce dernier point sert de passerelle lexplicitation de notre propre exploitation des donnes dans une perspective de TAO. 4.2.3.1 Structure gnrale Le DI possde une structure pyramidale dont le sommet non lexical est appel dictionnaire ontologique duquel partent un certain nombre de liens vers des catgories ontologiques prdfinies (tre et non-tre la racine, etc.). La base de la pyramide est constitue des units lexicales satures, savoir les mots ou locutions pour lesquelles suffisamment de traits smantiques et syntaxiques ont t implants en amont pour les dsambiguser. A partir de cette description, on peut concevoir le DI
36

Le Dictionnaire Intgral est une marque dpose par lentreprise Mmodata dont Dominique Dutoit, par ailleurs Directeur de Recherche associ au CNRS et au CRISCO, est le PDG. 37 TAO = Traduction Assiste par Ordinateur
74

comme un hybride de rseau smantique et darbre38 puisque part la racine (le dictionnaire ontologique) et les units satures, chaque terme ou concept possde un ou plusieurs lien(s) vers des archilexmes de type gnrique ou conceptuellement englobants, un ou plusieurs lien(s) vers des lexmes quil englobe et des liens de parent lexicale (synonymie, para-synonymie, appartenance de classe) avec les autres lments prsents dans la mme case39. Globalement, le Dictionnaire Intgral se prsente sous la forme dun rseau multidimensionnel de 250 000 mots, recouvrant de manire quasi exhaustive le lexique du Franais. On doit comprendre par multidimensionnel quil existe plusieurs phases lexicales dans le DI, que chaque lexme instanci possde des liens multiples et de diffrentes natures avec les autres et quil est possible de paramtrer ces liens sans limite a priori hormis les contraintes lies linformatisation et au stockage en mmoire machine. 4.2.3.2 Les trois dimensions du DI La premire dimension est constitue dun dictionnaire classique de la langue pur de presque tous ses lments non discriminants ou dfinitoires. Chaque lexme est dgroup selon les dfinitions disponibles dans le dictionnaire dorigine (en loccurrence le Petit Robert) ; les citations, renvois et contraires, exemples et parties lexicales des dfinitions qui sont juges non utiles ne sont pas conservs. En revanche, il est possible de prciser le type smantique et syntaxique des arguments ventuellement sous-catgoriss par lunit lexicale considre, sur la base des syntagmes exemples du Robert ou en fonction de lintuition de limplanteur (de la mme faon que les concepteurs du DEC). Ainsi, lentre du verbe aborder se prsente grosso modo comme suit dans le DI (impression visuelle fidle la page du vrai DI) : Aborder 140 /se mettre bord bord avec41 [arg142=navire43] /peronner [arg1=navire] /heurter (accidentellement) [arg1=vaisseau] Aborder2

38 39

Cest--dire un treillis ou une classification hritage multiple Case signifie ici toute portion du graphe visualisable lcran sous la forme de listes de termes corrls. 40 Entre lexicale deuxime niveau. 41 Dfinition pure dune lexie. 42 Une des fonctions syntaxiques : argument objet 1. 43 Type ou mot, ou les deux, pour largument objet 1.
75

/arriver au rivage44, arriver sur le bord [arg1(dans NP)45=lieu en bord de mer ou de plan deau] /atteindre, toucher [arg1=rivage] /arriver [arg1=lieu (inconnu)46] /sapprocher de, aller [arg1=qqn (inconnu)] /en venir [arg1=thme abstrait47] /arriver au bord de [arg1=situation] /commencer soccuper de [arg1=qqchose] /sengager dans [suj=vhicule ou sujmetony48=conducteur, passagers ; arg1=partie de voie] Le signe / dsigne un lexme qui possde un lien vers un autre lexme plus spcifique ou vers une unit lexicale sature. Cest en pratique le signal quil est encore possible de naviguer dans le graphe vers la base de la pyramide partir de la lexie prcde du signe. A chaque ligne du DI est associe une fonction grammaticale et une seule, une fonction lexicale et une seule, un code didentification, une marque catgorielle. Les fonctions seront rapidement explicites ultrieurement dans ce document, mais sans entrer dans les dtails car il est impossible den dresser la liste. Lorsquon aborde le DI au moyen de la recherche dun mot ou dun lexme, la page obtenue se prsente sous la forme dune liste de dfinitions tel que prsent plus haut. Il est noter que cette liste est ordonne arbitrairement en fonction de la frquence demploi suppose de chacune des dfinitions. Il sagit alors systmatiquement dun parti pris du concepteur de loutil car la construction de ce dernier se fait en dehors de toute utilisation de corpus ; Dominique Dutoit part du principe quil ny a pas de corpus suffisamment tendu ou reprsentatif pour tre pertinent dans sa dmarche, moins de constituer un corpus ontologique universaliste lequel, sauf sil pt exister ltat naturel, est inenvisageable car il serait immanquablement soumis larbitraire humain. Cette position est dailleurs paradoxale puisque lintgralit des travaux de Dominique Dutoit est soumise son propre arbitraire. Dans une seconde phase lexicale, sont pris en compte les renvois comme synonymes potentiels (accoster pour aborder1.1, aborder2.4 ; draguer pour aborder
44 45

Double dfinition, induction dune relation synonymique entre les deux dfinitions. Dans la fonction syntaxique [argument objet 1], cest lintgration dune contrainte sur la structure syntaxique de lobjet ( dans + [Arg1] ). 46 Donne de la situation dnonciation, servant prciser lobjet. Peut faire lobjet dune fonction lexicale spcifique. 47 Type dargument gnrique sur un plan ontologique (qui se rfre au contenu du DI lui-mme). Fonction lexicale galement. 48 Prcision sur le type de sujet (en loccurrence mtonymique vs. non mtonymique), fonction lexicale qui dtermine ce type par superposition avec la fonction syntaxique Suj.
76

2.4, entamer pour aborder, etc.), et ventuellement les contraires comme antonymes, ces derniers tant assez rares dans le Petit Robert. On y retrouve galement un grand nombre de collocations (comme arguments sujet ou objet) ainsi que certains termes associs avec les fonctions appropries. Il faut ce stade bien marquer lopposition entre dfinitions et renvois : les dfinitions se veulent les meilleurs quivalents du terme expliciter ; les renvois sont des synonymes contextuels, eux-mmes soumis au mme phnomne de dfinition et renvois. Pour viter la circularit des dfinitions (un mot dfini par un autre, lui-mme dfini par le premier), celles-ci sont essentiellement priphrastiques. En dehors de ces deux dimensions originelles, le DI est un rseau smantique ferm, i.e. il est toujours possible de trouver un chemin entre deux units lexicales quelles quelles soient sans tre oblig de sauter une case, cest--dire denjamber un lien qui nexiste pas. Cest grce cette proprit essentielle du rseau ferm quil est possible de systmatiser le calcul de la distance smantique entre deux termes. 4.2.3.3 Fonctionnement apparent et inapparent des liens au sein du rseau A lcran, chaque page visible du DI regroupe des units hirarchiquement quivalentes dun point de vue smantique. Ainsi, les mots moineau, autruche, msange, vautour peuvent apparatre sur une mme page parce quils sont tous les lments dune mme classe (celle des oiseaux). De mme, autruche pourra apparatre sur dautres pages comme celles portant ltiquette oiseau qui ne peut voler ou oiseau lev pour sa chair voire galement animal ou tre vivant. En clair, chaque unit lexicale peut tre appele diffrents niveaux du rseau smantique en raison de son appartenance thorique plusieurs classes en mme temps. Le principe de base du rseau est la recherche de lexhaustivit : par exemple, chaque unit doit tre directement rattache tous ses hyperonymes ainsi qu tous ses hyponymes identifis. Ce qui est intressant dans ce principe est quune unit lexicale nest implante quune seule fois dans le graphe, alors que ses liens sont multiples et lautorisent apparatre dans des pages diffrentes. Il y a donc ici un dcalage entre limplantation (un terme = un lieu informatique pour le programmeur) et la consultation par un utilisateur quelconque pour lequel chaque terme a le don dubiquit. Dans lesprit du DI, la notion d units hirarchiquement quivalentes dun point de vue smantique nest pas limitative partir du moment o les fonctions voques plus haut sont correctement dfinies et diffrencies. Ainsi, outre les autres oiseaux, autruche pourra tre associe dautres paradigmes lexicaux en vertu de la fonction lexicale ou syntaxique approprie49 :
49

En loccurrence, oiseaux qui ne volent pas, thmes associs, localisation sont des fonctions lexicales et phrasologie une fonction syntaxique.
77

Autruche --> meu, nandou, casoar, courvite (oiseaux qui ne volent pas) Autruche --> levage, course danimaux (thmes associs) Autruche --> Afrique, savane (localisation) Autruche --> se cacher, faire le mort (phrasologie : faire lautruche ), etc. Les liens tablis peuvent tre de nature hyperonymique dit lien pre-fils (rapport de la classe lobjet : oiseau est hyperonyme de autruche ), hyponymique ou fils-pre (rapport de lobjet la classe), synonymique ou frre (quasiquivalence de sens), parasynonymique (rapport de sens vident mais pas quivalent), morphologique ou intrinsque (paradigmes de conjugaison, forme plurielle, fminin) et la liste nest pas close. En ralit, tout dpend de la faon dont sont instancies les fonctions lexicales et grammaticales. 4.2.3.4 Enrichissement et exploitation du rseau Le DI est rgi par un programme qui permet de naviguer dun mot lautre en fonction des liens activs. La plate-forme informatique permet en outre dintroduire et de modifier loisir un trs grand nombre de traits smantiques, morphologiques et autres. Il est galement trs ais (en thorie) dajouter des traits nouveaux selon les besoins. La principale faiblesse du systme est de ne pas autoriser plus dune fonction dun type donn par terme ou lexme (sans doute par souci dviter le risque dexplosion combinatoire). En outre, lajout dune nouvelle fonction entrane la ncessaire rvaluation des algorithmes associs si lon souhaite lactiver. Autrement dit, le coefficient arbitrairement affect chaque fonction et chaque type de lien est susceptible de varier en permanence par lentremise du programmeur. Une telle absence de cohrence de calcul conduit infailliblement la mthode du moins mauvais rsultat. Autrement dit, si la rponse attendue une certaine requte offre le meilleur coefficient parmi tous les rsultats possibles, rien nest modifi ; en revanche, tout coefficient insuffisant ou toute rponse errone conduit la rvaluation prcite. 4.2.3.5 Diagnostic du DI en tant que rseau En thorie, le Dictionnaire Intgral est un prototype possible du lexique idal dans la perspective du traitement automatique de la langue. Jusqu prsent, son existence relevait de la science-fiction aux yeux des linguistes. Dominique Dutoit a eu
78

la constance et lnergie ncessaires pour mener terme un tel travail, lequel a ncessit prs de dix ans pour la seule implantation des donnes. Pourtant, son dveloppement est relativement simple. Il est ainsi extrmement facile dimplanter un nouveau mot : il suffit de lui dfinir un lien de parent avec un terme dj instanci pour lui permettre de trouver immdiatement sa place dans le rseau, dautres liens tant automatiquement activs partir du premier. Rien nempche galement dactiver ou de dsactiver de nouveaux liens entre des lexies dj prsentes dans le graphe. Dautre part, tout le rseau est paramtrable merci tant le programme qui le gre est mallable et complet. Enfin, la nature mme du DI permettrait denvisager son extension diffrentes langues, condition dimplanter tous les termes des langues vises mais sans quil soit ncessaire de modifier le programme daucune faon. Au rayon des cueils, on peut citer la grande dsorganisation gnrale du rseau, chaque lexme tant choisi arbitrairement et implant de mme, avant dtre rcrit ou dplac le cas chant sur le mode empirique : si les rsultats du calcul de la distance smantique sont bons, on laisse les choses en ltat ; sils sont mauvais, on rvalue. Par consquent, la validit gnrale du DI peut tre remise en cause car elle ne repose sur aucun cadre thorique prdfini, hormis la mthodologie et le cadre ontologique choisis par les concepteurs eux-mmes. Dautres difficults subsistent comme celles prcdemment voques concernant la slection et lajout des fonctions lexicales et grammaticales ainsi que la dcision de fermer le rseau : quel moment dcide-t-on quune unit lexicale est sature ou non ? 4.2.3.6 Lalgorithme Nous navons pas eu accs la forme mathmatique de lalgorithme utilis pour exploiter les donnes du DI mais nous savons quil est fond en grande partie sur le calcul de la distance smantique entre les units lexicales tudies. Nous savons que cette distance se calcule principalement en fonction du nombre de liens qui sparent deux termes dans le rseau avec un coefficient diffrent pour chaque lien. Mais nous ne pouvons pas vraiment en dire plus sinon que les outils dvelopps autour du DI utilisent tous le mme algorithme, daprs les propres dires de Dominique Dutoit. Il faut rappeler que ce systme est corpus zro car il est entirement fond sur les connaissances issues du DI et ne ncessite aucun apprentissage pour lactivation et lamlioration de ses performances. Cette mthode comporte un risque, qui est de reproduire en les amplifiant les erreurs qui ont pu tre commises lors de limplantation des units lexicales dans le rseau. Toutefois, le pourcentage drisoire de ces erreurs nexcde srement pas celui mesurable dans un corpus, dautant quil est possible de les corriger facilement ds quelles sont dtectes.
79

Voici maintenant un aperu du fonctionnement de ces algorithmes sur un exemple de rduction lexicale, i.e. la paraphrase dun syntagme nominal en un seul mot. Lobjectif de la manuvre sera ici deffectuer la rduction lexicale de Personne qui vend des fleurs, cest--dire de proposer pour ce syntagme la lexiesynonyme la plus approprie. Le Smiographe, outil gnraliste de TAL associ au DI, effectue le calcul simultan de la distance entre les diffrents termes qui composent le syntagme instanci et toutes les units lexicales rpertories dans le rseau. Pour chaque unit, trois rsultats sont renvoys, correspondant trois modes de calcul diffrents : Concernant le premier algorithme, il sagit du rsultat du calcul du plus court chemin entre lentre (mot seul ou partie de syntagme) et la sortie (mot). Il est appel processus dactivation par D. Dutoit. Supposons que nous souhaitions activer le chemin entre les lexies A et D.
Figure 2 : Chemin dit dactivation

A -----> B -----> C -----> D

Le processus dactivation consiste calculer le rapport entre A et D sans passer par le calcul des segments AB, BC ou CD afin dviter des obstacles potentiels entre les arcs intermdiaires. Pour un syntagme comme personne qui vend des fleurs, il sagit deffectuer le calcul dactivation entre tous les mots pertinents du syntagme ( savoir ici les mots non grammaticaux personne, vendre et fleurs) et la totalit des mots du graphe. Dans cet ordre dides, on considre que A D, cest tout ce qui est jug utile pour ce calcul : le calcul du chemin est implicite, chaque lien intermdiaire se voyant assign une valeur par dfaut identique celle de tous les autres liens, quelle que soit leur nature. Lintrt majeur de cet algorithme rside dans la rapidit de calcul quil permet. Linconvnient, qui en dcoule directement, est quil ignore la spcificit de certains liens intermdiaires. A titre dexemple, on peut citer le cas du rapport de proximit smantique entre eau et oxygne dune part, eau et liquide dautre part. Selon le processus dactivation, le rsultat sera le mme dans les deux cas car il ne fera pas la diffrence entre une relation de type lment atomique ; composant et une autre comme spcifique ; membre dune classe , do le renvoi de rsultats incorrects sinon incomplets.

80

Pour les deuxime et troisime algorithmes, les rsultats vont de 0,1 (meilleur score dactivation) 140 (plus mauvais) et se rpartissent gnralement de la faon suivante : Pour le deuxime algorithme, le rsultat du processus dactivation est pondr par les coefficients affects chaque type de lien. Une relation dhyponymie se verra par exemple affecte dun coefficient 0.5, une relation dappartenance une mme famille 0.8 et ainsi de suite. Le produit de tous les coefficients des liens qui sparent deux lexies donne le score du chemin considr. On comprend ds lors pourquoi le produit de liens proches ( valeur < 1) mne un rsultat proche de 0,1 alors que celui de liens plus distendus ( valeur > 1) fait augmenter le coefficient vers la limite autorise , i.e. 140. Le fonctionnement du troisime algorithme ne nous est pas apparu trs clair, en tout cas pas directement perceptible lors de nos visites chez Dominique Dutoit qui na pas souhait nous le dvoiler. 4.2.3.7 Les outils associs au DI Lambition de MEMODATA est dlaborer et de proposer tous les outils possibles et imaginables en TAL partir dune seule interface. On peut citer comme dj oprationnels partir du DI le dictionnaire de synonymes, le routeur de messages, le lemmatiseur, le rsumeur de textes, le phontiseur (seul ne pas fonctionner exclusivement sur le DI), le dictionnaire thmatique, le paraphraseur et probablement dautres cette heure. Un analyseur syntaxique tait rcemment en projet. Pour celuici, lquipe de Memodata recherchait activement une mthode efficace de reprsentation (cf. les grammaires de proprit), tant entendu quaucun modle propos ce jour na fait ses preuves sur lensemble des formes syntaxiques dune langue donne. Comme nous lavons dj mentionn, tous les outils fonctionnent sur le mme algorithme et nous ne pourrons en valider le contenu qu la double condition que les formules utilises soient cohrentes et que les outils seront capables davoir des rsultats probants sur un corpus large, tant entendu que les exprimentations menes sur place portent essentiellement sur des exemples choisis par les concepteurs du systme eux-mmes. 4.2.3.8 Conclusion et perspectives autour du DI : un bilan mitig A notre avis, le Dictionnaire Intgral justifie lui seul tout lintrt que lon peut porter aux travaux de Dominique Dutoit. Les donnes quil renferme sont peut81

tre uniques au monde et la plate-forme ergonomique qui gre le rseau est dexcellente facture. Il vaut videmment mieux rester prudent avant dencenser le systme, mais en volume et en implantation informatique, le commentaire est pertinent. Lautre atout de lentreprise est dtre parvenue laborer un seul et mme algorithme pour lensemble des outils dvelopps. Dun point de vue linguistique, lide de mesurer la distance smantique entre les termes (voire entre les syntagmes) nous parat constituer une avance majeure dans le domaine du TAL et nous y souscrivons avec dautant plus dintrt que cette dmarche est tout fait conforme aux ides que nous entendons appliquer dans nos propres recherches sur les lexiques multilingues, lesquelles sont la justification du prsent document. En revanche, nous entendons faire preuve dune plus grande rigueur dans certains domaines, en particulier pour ce qui concerne la rvaluation des donnes douteuses. Au rayon des faiblesses, nous pouvons citer la fois le manque de visibilit et de lisibilit du systme. Si nous sommes tout dispos louer le DI pour sa seule existence, nous nous montrerons beaucoup plus circonspect en ce qui concerne la partie mathmatique. Par ailleurs, la complexit et la lourdeur du rseau smantique le rendent presque inutilisable par quelquun dautre que les membres de lquipe sans formation adapte (do la ncessit dun sjour sur place, que nous avons dailleurs effectu). En guise de conclusion provisoire, nous insisterons nouveau sur la richesse exceptionnelle du DI ainsi que sur les rserves que nous mettons au sujet de ses extensions. Pour une bonne exploitation du Dictionnaire Intgral, il nous semble indispensable de tester les diffrents outils oprationnels en situation relle. En cas dchec de lalgorithme, il sera plus facile de modifier ce dernier que de rcrire le rseau smantique dans son intgralit. En ce qui concerne la partie spcifique de la traduction multilingue, notre souhait fut initialement dexploiter et damnager le rseau pour ladapter nos besoins sans tre oblig den modifier la structure. Lide que nous eussions souhait mettre en pratique tait la suivante : tant donn que chaque unit lexico-smantique (notion prciser, chaque unit lexicale tant divisible en plusieurs units smantiques et vice-versa) du franais est dj implante, peut-tre pouvons les transformer en cases lexico-smantiques multilingues o la lexie de chaque langue possde les mmes caractristiques smantiques que les autres lexies de la mme case. Il sagirait simplement dun lexique multilingue intgr un rseau smantique. Si cette ventualit trouvait confirmation dans la pratique, il resterait effectuer le transfert syntaxique dune langue lautre. Mais pour linstant, notre objectif demeure exclusivement la dsambigusation lexicale. Le DI est dit universaliste apriorique, cest--dire quil est cens englober toute (ou presque toute) la connaissance langagire dun locuteur du franais autant quil est
82

capable de prdire les noncs valides. En dautres termes, il est sous-tendu par la thorie textesenstexte et autorise ainsi les oprations de comprhension et de gnration avec la mme facilit, comme nous lavons voqu en introduction. Contrairement des thories plus normatives ou conduisant naturellement une certaine rigidification du langage, la TTST entend dcrire la langue telle quelle peut (pourrait) tre et non pas (ou plus seulement) telle quelle est (position indfendable) ou telle quelle doit (devrait) tre (vision normative non conforme lexistant). Ce vu pieux trouve partiellement un cho au travers du DI.

4.3 Quelques thories et applications en smantique lexicale 4.3.1 Thorie Sens/Texte par Meluk, Polgure et alii.
Les tenants de la thorie Sens/Texte posent le problme des limites de la description lexicale ( on cre une fonction lexicale chaque fois quune lacune est rencontre dans la description ). Le mode de construction du lexique partir de cette thorie a pour effet de rigidifier le cadre demploi des units lexicales et rend du mme coup le langage comme il doit (devrait) tre et plus seulement comme il est malgr la grande richesse des modles proposs. Cela rappelle un peu le locuteur idal imagin par Chomsky pour les modles syntaxiques, sans parler de la complexit des lexmes et surtout du temps considrable ncessaire pour modliser chaque acception. Au demeurant, lutilisation de fonctions lexicales comme le dfinissent les concepteurs du DEC peut aider avantageusement la correspondance interlangue, comme prcis dans la leon inaugurale dIgor Meluk. Mais de notre point de vue, elle risque de brider excessivement lexpressivit de la langue. Une des caractristiques les plus importantes du DEC est que les donnes sont ajoutes en fonction de lintuition des concepteurs, et non pas par le truchement de donnes attestes. Le travail nen est que plus long, mme si nous ne le considrons pas comme invalid par la mthode.

4.3.2 Texte-sens-texte (TTST) selon Dutoit.


Cest lide a priori la plus la plus proche de nos dsirs mais pas la plus satisfaisante scientifiquement parlant. Le but est de modliser le langage plus (ou pas seulement) comme il doit (devrait) tre ni comme il est mais comme il peut (pourrait) tre. Du ct mathmatique, le problme rside dans lapproximation humaine et individuelle des algorithmes employs. Du ct linguistique, on peut galement douter de la validit de la structure smantique du rseau conu sur la base de cette thorie, partir du moment o elle ne repose que sur les reprsentations mentales et sur la connaissance du monde du concepteur. Lapplication de la TTST la gnration automatique de corpus est lcueil le plus dangereux. La mthodologie consiste reprsenter la langue telle quelle pourrait
83

tre afin de gnrer un nombre trs lev dnoncs servant leur tour de corpus de base dautres reprsentations et applications du langage. Le pril est l vident. Il na dailleurs pas t vit.

4.3.3 Le lexique gnratif (LG) ou le traitement de la polysmie par la reprsentation "pustejovskyenne"


tout le moins en apparence, le lexique gnratif rend trs imparfaitement compte de la polysmie au-del des questions de polymorphie ou de polysmie logique. Les principes de coercion, co-composition ou de type point semblent inapplicables (ou non gnralisables) en dehors dexemples ad hoc, mais il est vrai une fois de plus que le formalisme est complexe pour qui na pas particip son laboration. 4.3.3.1 Prsentation gnrale et critique densemble Lun de nos souhaits initiaux tait de proposer une modlisation de la polysmie verbale avec laide de la thorie du Lexique Gnratif labore par James Pustejovsky. Avec lappui du LG, il paraissait possible premire vue dimaginer une reprsentation commune des diffrents sens dun verbe polysmique. Or, nous estimons prsent que cela nest pas tellement le cas et que le LG est un formalisme prioritairement vou au traitement de la polymorphie des structures syntaxiques induites par les mots du lexique et non pas la polysmie de ces termes eux-mmes. Pour renforcer ce point de vue, nous pouvons dire que Pustejovsky regroupe sous le terme de polysmie ce que nous appelons (pour ce travail) polymorphie, et quil nomme homonymie ce que nous entendons par polysmie. Pierrette Bouillon corrobore ce point de vue dans sa thse en prsentant le LG comme loutil idal pour identifier les alternances, verbales ou nominales, les diffrences dans la forme syntaxique des complments ainsi que les diffrences aspectuelles (opposition accomplissement/procs, par exemple). Il est cependant dommage quelle sattache exclusivement expliciter le principe de coercion, sans voquer le potentiel de la co-composition ou de liage slectif. Le LG semble tre galement efficace en ce qui concerne lacceptation ou le rejet des noncs mtonymiques : 19) Marie croit le livre 20) Marie prend le livre 21) *Marie prend le livre puis croit tout ce quil dit

84

Grce linteraction entre les trois niveaux de la structure du mot livre, les deux premires phrases sont acceptes par le LG. Le processus consiste ici prsenter le lexme livre comme pouvant tre soit une (source d) information, soit un artefact : ARGSTR = ARG1 = y : information ARG2 = x : objet_physique

Cette reprsentation de la polymorphie nest pas sans rappeler les graphes conceptuels de Sowa. Ceci nous inspire quune entre du LG nest ni plus ni moins quune modlisation de la structure conceptuelle parcellaire dun terme. La structure des qualia elle-mme confirme ce point de vue en faisant le lien entre les deux types qui forment le type livre (le livre est un artefact qui contient des informations) ainsi quen distinguant les diffrents prdicats intervenant dans sa structure conceptuelle. Bien quoffrant des perspectives plus larges pour le traitement de linterface smantique/syntaxe, le LG parat encore loin de matriser la question globale de la conceptualisation. En effet, on ne doit pas ignorer que le livre est non seulement crit et lu (ou susceptible de ltre), mais galement dit, imprim, achet, rcompens, etc. Mais ces informations sont de toute faon probablement sans intrt pour le traitement automatique en raison du double principe dvitement des informations superflues et dconomie des traits implments. 4.3.3.2 Les mcanismes gnratifs Le mcanisme de la coercion Si lon sen tient au qualia de livre, certains rameaux du graphe conceptuel sont ignors :

QUALIA = information.objet-physique-lcp FORMAL = contient (x,y) TELIC = lire (e2,w,x,y) AGENTIVE = crire (e1,v,x,y) En vertu du principe de coercion, les formes syntaxiques qui ne sont pas prvues dans la structure des arguments mais qui respectent la structure prdicative contenue dans les qualia sont recevables par le LG. En lisant entre les lignes, nous sommes tents de comprendre que les formes syntaxiques acceptables mais non prvues sont valides implicitement par le lexique. Aprs rflexion, le processus est probablement beaucoup plus efficace que cela. Il est vident quune modlisation purement implicite dun phnomne linguistique devient hasardeuse lorsquil sagit de lexpliciter aux yeux des lecteurs profanes.
85

Pour mieux comprendre notre dmarche rflexive, voici un exemple tir de la thse de P. Bouillon, phrase destine nous clairer sur le principe de coercion : 22) Jean est triste de lire ce livre (objet=EVENEMENT) 23) Jean est triste cause de ce livre (objet=INDIVIDU NON-ANIME) Daprs Pierrette Bouillon :
Dans LG, la coercion agit au niveau smantique. Elle permet un prdicat de changer le type smantique de ses arguments en celui quil requiert, pour autant que ce dernier soit prsent dans la structure des qualia de cet argument. Bouillon (1996)

Pour les phrases (22) et (23), on note que triste ne sous-catgorise dans le lexique quun complment de type VNEMENT. Et Pierrette Bouillon ajoute :
Quand le type de largument est diffrent, il y a alors coercion : le prdicat a le pouvoir de transformer le type de largument en celui quil exige. Bouillon (op. cit.)

tant donn que les miracles existent peu dans ce domaine, il nous a paru probable quil y avait autre chose derrire cette thorie de la coercion. Cette autre chose doit ncessairement tre un phnomne mcanique pour permettre au LG de fonctionner au moins en thorie. Observons ce qui se produit au niveau de la phrase (24). On sait dj que triste ne sous-catgorise quun complment de type EVENEMENT, et que cause du livre nest pas reconnu comme un vnement a priori. En regardant les qualia de livre, on saperoit quil est susceptible dtre lu ou dtre crit. Les traits lire et crire renvoient des units lexicales rpertories comme des vnements part entire. Cest ainsi que sopre la magie du principe de coercion. Dans ce cas prcis, cest lutilisation de lobjet (la possibilit dtre lu) qui autorise la construction de la phrase Jean est triste cause du livre et permet ainsi lellipse du prdicat vnementiel, devenu superflu. En fin de compte, il nest pas ncessaire de prciser les concepts inhrents la fabrication et la diffusion du livre puisque les qualia prvus suffisent rendre compte de la polymorphie observe en (22) et (23). On pourra juste ergoter sur lapproche conceptuelle du trait AGENTIVE en proposant une distinction entre les activits de cration (write), de fabrication (print, bind) et de diffusion (publish). Ces trois oprations interviennent presque toujours dans le processus de production dun livre.
86

Considrons maintenant les exemples suivants : 24) Jean est triste cause des dlais dimpression du livre 25) *Jean est triste cause du livre (en parlant de son impression) Si lon accepte le prdicat impression comme faisant partie de la structure conceptuelle et fonctionnelle de lobjet livre, alors la coercion doit autoriser la phrase Jean est triste en raison du livre (en parlant de son impression). A notre sens, les limites des principes gnratifs noncs par Pustejovsky se rvlent ds lors que lon essaie dtendre ses applications, que ce soit des structures grammaticales nouvelles ou de nouveaux maillons de la chane conceptuelle des termes tudis. Observons lexemple suivant : 26) Jean est triste cause du livre. - Quoi, il nest pas bon ? - Si, mais a trane limpression. Lexemple (26) montre quun minimum de prcision est apparemment ncessaire mais suffisant pour autoriser lemploi de Jean est triste cause du livre pour le cas o ce serait limpression du livre qui tait la cause de la tristesse. Manifestement, ce phnomne fonctionne galement avec ldition, la critique, la vente, etc. En ce sens, on peut dire que le livre peut se rapporter en contexte tout lment de la chane conceptuelle qui sy rapporte, sur le mme modle que le prix Goncourt dcrit par Sowa. Pour en revenir la coercion, et si nous en avons correctement compris le principe, le Lexique Gnratif fonctionne grce linteraction entre les diffrentes entres lexicales. Si lanalyseur rencontre un obstacle li au contenu de lARGUMENT-STRUCTURE, il lui est possible de consulter la structure des qualia afin dy trouver des ouvertures vers les concepts qui y sont exprims. Dans leur article le traitement lexical de la coercion (Cahiers de Linguistique Franaise, n14), D. Godard et J. Jayez proposent une critique des mcanismes du principe de coercion noncs par J. Pustejovsky. Ils lui reprochent en particulier dnoncer des principes gnraux, den dmontrer leur efficacit sur des entres lexicales dont il dtermine lui-mme la structure de traits et de prtendre quils sont applicables dans tous les cas similaires. Selon eux, ce parti pris ne rend pas compte des rgles complexes de lexicalisation inhrentes chaque unit lexicale. Nous allons maintenant discuter lexemple quils proposent pour illustrer leur propos : 27) Lauditoire commence couter la symphonie 28) Jean commence lire le livre
87

29) *Lauditoire commence la symphonie 30) Jean commence le livre Les phrases (28) et (30) sont prsentes par Pustejovsky pour illustrer le principe de coercion : tant donn que lire est la fonction habituelle (son rle tlique) attribue un livre, on peut en dduire la validit de la phrase (30) partir de la (28). Jayez et Godard contestent ce point de vue en indiquant que ce qui est valable dans ce cas prcis ne lest pas ncessairement pour dautres constructions prdicat+objet tel que celui exprim en (27). Partant du principe que la fonction dune symphonie est dtre coute aussi bien quun livre est destin tre lu, les auteurs rfutent donc la validit de la coercion telle quelle est conue pour le Lexique Gnratif. On pourra objecter ces derniers que les rles attribuables [lire_livre] et [couter_symphonie] sont de natures diffrentes dans la mesure o le lecteur dun livre a un rle actif tandis que lauditoire dune symphonie na quun rle passif. Dans ce dernier cas, ce sont les interprtes de luvre musicale qui remplissent un rle intermdiaire entre la cration et la dcouverte. Le passage dune uvre un public nest donc pas un processus identique pour tous les objets concerns : crire (x, livre) lire (y, livre) ; crire/composer (x, symphonie) interprter (y, symphonie) couter (z, interprtation_symphonie)50. Ceci nous ramne une question importante : que doit-on choisir comme rle tlique pour le nom symphonie ? La fonction dune uvre musicale est-elle dtre interprte ou dtre coute ? Quelle quen soient les rponses, ces interrogations nous ramnent une constatation dordre plus gnral : notre avis, les mots du lexique sont des units intrinsquement trop complexes pour tre reprsentes systmatiquement selon un modle unique.
Le principe de co-composition Pustejovsky prsente ainsi son principe de co-composition :

Briefly, co-composition describes a structure which allows, superficially, more than one function application. We begin by studying the polysemy of baking verbs to illustrate this point. In (45) below, the verb bake has two meanings, both a change of state sense and a creation sense. (45) a. John baked the potato. b. John baked the cake.
O x, y et z correspondent des individus ou des ensembles dindividus effectuant une certaine action sur lobjet en second paramtre.
88
50

La structure lexicale propose par J.P. pour le verbe to bake est la suivante :
Bake EVENTSTR = E1 = e1 : process HEAD = e1 ARGSTR = ARG1 = 1 animate_ind FORMAL = physobj ARG2 = 2 mass FORMAL = physobj QUALIA = state_change_lcp AGENTIVE = bake_act (e1, 1, 2)

Ce qui est exprim pour ce principe, et que Pustejovsky prcise dailleurs, cest que bake ne prend quun seul sens. Ce nest donc pas le verbe qui varie ici, mais la relation logique entre le prdicat et son objet. La co-composition fonctionne par unification dun ou plusieurs traits de la structure des qualia du prdicat et de son objet. Ce principe a t nomm en anglais cospecification par Pustejovsky (1991). Dans lexemple prsent ici, le trait bake-act dsigne la fois lAGENTIVE de bake et celui de cake. On peut imaginer sans peine que ce mme trait est partag par potato. A premire vue, rien ne permet de distinguer cake de potato en termes de contraintes de lexicalisation. Dans ce cas prcis, la co-composition nous apparat plus comme un outil danalyse linguistique mais semble moins pertinent (nous voulons dire utile) dans une perspective de modlisation. Lexemple de bake a cake/potato nous parat sous-tendre une proprit smantique originale que lauteur voque demi mot. Si la cuisson dune pomme de terre induit un changement dtat de cette dernire, elle nen reste pas moins une pomme de terre, on nassiste dans ce cas quau passage dune pomme de terre crue une pomme de terre cuite. En revanche, il nen est pas de mme pour un gteau qui nest pas un gteau avant la cuisson. Cest en cela que le principe de co-composition devient intressant dans ce cas prcis, savoir que lon autorise le remplacement dun lexme qui va tre modifi (la pte cuire) par le lexme reprsentant le rsultat du procs exprim par le prdicat. La traduction smantique littrale de lexpression cuire le gteau devrait donc tre : cuire la pte afin de crer le gteau.

89

Ainsi, la co-composition va chercher dans le trait AGENTIVE de cake la lgitimit de lutilisation de ce dernier comme argument du prdicat. La transition est ici exprime par le rsultat.

4.3.4 Les classes dobjets, les paradigmes collocationnels (Vronis, Gross, etc.).
4.3.4.1 Les classes dobjets de Gaston Gross Un des fils conducteurs des recherches de Gaston Gross est sa volont constante de rendre les dictionnaires plus actifs 51. Parmi les thmes quil a dvelopps, le plus important est sans doute la notion de classes dobjets ainsi que les oprateurs appropris quil leur associe :
Prenons deux substantifs comme bus et manteau. Les dictionnaires usuels ne prcisent pas quil sagit dans les deux cas de substantifs concrets, parce que cest une vidence pour le lecteur. Les dictionnaires lectroniques52 portent cette indication, puisquelle permet de prdire un grand nombre de phrases correctes. Par exemple, tous les concrets peuvent tre complments de verbes comme voir, regarder, etc., ou tre sujets de prdicats comme avoir (telle ou telle) couleur, peser (unit de mesure de poids), coter (unit de mesure de prix), etc. Au regard du codage, ces verbes sont compatibles avec les deux substantifs que nous avons envisags. Mais, ces indications, bien que ncessaires, ne sont pas encore suffisantes pour rendre compte du fonctionnement syntaxique de ces noms. En position dobjets du verbe prendre, ils slectionnent des sens diffrents de ce prdicat. Une phrase comme : Luc a pris (le, son) manteau Signifie peu prs quil ne la pas laiss la maison. Tout autre est le sens de prendre avec bus. Dans la phrase : Luc a pris (le, son) bus Le verbe prendre peut tre paraphras par emprunter, voyager en. On voit donc que si nous codons les deux substantifs avec le seul trait concret, nous ne sommes pas en mesure de prvoir le fonctionnement syntaxique de lun et de lautre, et par consquent, de gnrer automatiquement toutes les phrases que lon peut construire autour deux. Ajoutons donc une information supplmentaire, en codant le mot bus comme un moyen de transport en
De larticle du mme nom : Gross G., 1996. Rendre les dictionnaires plus actifs in Lexicographie et informatique. Autour de linformatisation du TLF. Actes du Colloque International de Nancy (29, 30 et 31 mai 1995) publis par David PIOTROWSKI. Didier rudition, Paris. 52 Gaston Gross oppose les dictionnaires lectroniques destins au traitement automatique de la langue aux dictionnaires informatiss qui se contentent de transformer les dictionnaires papier en version informatise lidentique.
90
51

commun et manteau comme un vtement. Nous pouvons maintenant tablir la liste des prdicats qui sappliquent lune ou lautre classe et, par voie de consquence, tous les lments de chacune. Nous appelons ces sousensembles des classes dobjets et les prdicats qui les dfinissent des prdicats appropris. Gross G. (1996b :196)

Comme le postulent Meluk et ses collaborateurs, Gaston Gross propose la gnralisation de traits spcifiques pour des substantifs dont la structure de traits permet de prdire quels prdicats ils peuvent tre associs. Cette mthode pose deux problmes majeurs : Comme le rappelle Sowa dans sa critique de Katz et Fodor (voir dans ce chapitre en 4.2.), un ensemble de traits ne suffit pas pour rendre compte de la complexit des lments du lexique. Il est ncessaire pour complter ce dernier de prendre en compte des critres plus profonds comme les rles et relations entre lments du graphe conceptuel de chaque unit lexicale. En rduisant chaque terme un membre dune classe, on lui interdit dans une certaine mesure de faire jouer son potentiel dessaimage polysmique vers dautres classes, y compris si cette polysmie sexerce au prsent vers des classes ou il nest pas (encore) lexicalis. Grce aux classes dobjets, Gross caractrise une polysmie des prdicats en fonction de la description des traits de ses arguments. Outre sa relle efficacit du processus en traitement automatique (au moins par rapport un systme simple sans classes dobjets), la mthode semble ignorer la polysmie potentielle des objets euxmmes. Reprenons lexemple de bus, nous pouvons dire que ce mot est en contexte un moyen de transport en commun, un moyen de transport individuel, un jouet miniature, un conducteur lectronique voire un objet quelconque ou un projectile53 (en se mettant la place de King Kong dans ces deux derniers cas). Pour chacune des classes prcdentes, prendre le bus aura donc un sens diffrent qui ne peut tre caractris que par le contexte. Dans notre propre mthodologie, nous utilisons les classes dobjets la mesure de ce que les dictionnaires bilingues proposent comme collocations associes chaque prdicat. Toutefois, nous esprons ouvrir nos bases des objets et

53

Ce dgroupement des classes dobjets tient moins la polysmie de bus qu la vision que chacun peut avoir de lentre lexicale. Pour cette dernire vision, un mme objet bus peut rentrer dans des classes dobjets diffrentes et donc saccoler des prdicats diffrents selon Gross. En ce sens, le dictionnaire de Dutoit est plus proche de cette ralit par le jeu de son multidimensionnalisme que les classes dobjets.
91

des critres plus abstraits par lobservation des corpus littraires sans prjuger du sens des lexies hors contexte. Les thories sur les classes dobjets posent galement une fois de plus le problme de lorigine des donnes : en gnral, celles-ci sont issues de corpus en majorit journalistiques ou encore nes de lintuition des concepteurs. Cela tant admis, lobjectif des travaux de G.Gross sur les classes dobjets est de constituer une typologie des objets du monde au sens le plus large possible, afin dobtenir une ontologie complte. Mme si cette ontologie repose sur une vision fige de la langue, il sagit dun travail considrable. 4.3.4.2 Les paradigmes collocationnels Initi par Jean Vronis, un grand projet de recensement des paradigmes collocationnels pour un grand nombre de mots du franais na notre connaissance jamais vraiment vu la lumire. Dans son projet dorigine, Vronis proposait la cration dune gigantesque base de collocations associes chaque mot, le tout prsent sous la forme dun dictionnaire monolingue. Toutes les informations devaient tre recueillies partir de journaux. Au demeurant, cette entreprise est quivalente la ralisation de John Sinclair, le COBUILD, pour langlais. Dans le mme esprit que la recherche des contextonymes effectue par lquipe de Sabine Ploux et dont nous venons de parler, Peter Blumenthal a galement ralis de trs importants travaux pour constituer un dictionnaire des collocations du franais dont on peut apercevoir quelques bribes dans le numro 150 de Langue Franaise en juin 2006. Son vocation des collocations des termes daffect ne sont dailleurs pas sans rappeler les recherches dEveline Martin dont on trouve trace dans son ouvrage de 1993. Ces diffrents travaux nous amnent effectuer une distinction importante entre les collocations qui se rapportent des lments frquemment prsents dans le contexte dun terme et les arguments sujet et objet dun verbe ou dun lment prdicatif dune autre catgorie grammaticale que le verbe. Pour le prsent document, nous employons le terme collocations quasi exclusivement pour les seconds. Les collocations du co-texte proche, aussi nommes dclencheurs ou contextonymes dans certains cas, ne nous ont pas proccup pour linstant de par lampleur et la complexit de leurs paradigmes. Le domaine des collocations est luimme assez vaste et difficile dlimiter, comme le montrent Manguin et Franois (2006) en confrontant les collocations troites, asymtriques et lches leurs modles de synonymie. Les quasi-phrasmes les plus tablis ont selon leurs conclusions un caractre purement conventionnel et sont dans leur ensemble des emplois combinatoires libres .
92

4.4 La tentation de toucher tout


John Sowa prcise pour ses propres reprsentations quelles doivent faire apparatre toutes les informations pertinentes dun mot pour un emploi donn. Dans ses critiques des formalismes qui ont prcd le sien, il en signale chaque fois les limites en mettant en avant que certaines informations importantes ne pouvaient y tre codes car ces formalismes ignoraient un ou plusieurs des mcanismes de relation smantique, structurelle ou conceptuelle inhrents au langage. La tentation de toucher tout mne la prise en compte de toutes les donnes lexicographiques, textuelles et intuitives possibles. Elle conduit galement ltude de toutes les donnes utiles pour un transfert interlangue, quelles soient syntaxiques, smantiques ou les deux la fois. Enfin, elle cherche aboutir des modles qui confrontent ceux proposs par les autres thories (fonctions lexicales, distance smantique, champs smantiques, primitives, classes ontologiques, fonctions syntaxiques, constructions, collocations, classes-objets, liens smantiques multiformes, co-reprsentation multilingue, variables contextuelles, etc.). Cette pseudo-thorie demande naturellement tre nuance. Pour commencer, il nest pas raisonnable denvisager des modles qui engloberaient la totalit des connaissances ncessaires la juste interprtation dune occurrence ou dun nonc. Ensuite, la recherche systmatique de la prcision la plus fine conduit une formalisation tellement pointue quelle en devient inexploitable. Enfin, le simple recueil de toutes les donnes linguistiques et extra-linguistiques est tout simplement impossible. Le mieux que nous ayons proposer dans limmdiat est de recenser lensemble des donnes pertinentes visibles dans les ouvrages lexicographiques, de les ordonner conformment des modles polymorphes, et de les enrichir le cas chant par des exemples issus de sources non dictionnairiques. Autant que faire se peut, nous viterons davoir trop souvent recours lintuition, non pas parce que celle-ci nest pas digne dintrt, mais avant tout parce quelle conduit un travail de trop grande ampleur qui demande tre vrifi constamment dans le plus strict arbitraire ou pas du tout, au risque de se tromper gravement sur la ralit de la langue. Le DEC de Meluk et de ses collaborateurs est le meilleur exemple connu de travail intuitif de longue haleine ncessitant de nombreuses petites mains pour la description dun nombre de lexies trs limit.

5. Transition
Aprs avoir discut de nos plus importantes sources dinspiration, nous allons initier ds le chapitre suivant la description du parcours que nous avons fait effectuer aux lexmes pour les amener jusqu la transformation en lexies gnratrices de liens synonymiques avec les autres lexies de toutes les langues. Avant daborder les analyses linguistiques et les tentatives de modlisation que nous concluons par lalgorithme final, nous allons revenir sur lorigine de nos travaux,
93

savoir sur la ralisation, lobservation et lexploitation des Lexiques Inverss ou LI tels que nous les avons dj dfinis en introduction cette thse.

94

CHAPITRE II Outils et analyse lexicographiques : Lexiques Inverss et Construction de Champs Lexicaux et Smantiques

95

1. Introduction de partie 1.1 Prsentation


Ce deuxime chapitre prsente lessentiel de nos travaux de dpouillement de donnes lexicographiques, la mthodologie sur laquelle nous nous sommes appuy pour les mener, les outils danalyse ainsi que lensemble des principes, matriaux et conclusions corrlatifs. En premier lieu, nous expliquons le fonctionnement des Lexiques Inverss (LI), cration originale qui constitue lun des fondements de nos recherches, trouvant leur aboutissement dans la dfinition dun algorithme gnral de construction de graphes smantiques. Les LI et leur prolongement sont dirigs par un certain nombre de principes que nous dtaillerons avec prcision. Ensuite, nous prsentons les analyses partir de plusieurs verbes diffrents pour illustrer un certain nombre de phnomnes inhrents aux correspondances entre langues : aborder et ses quivalents italiens comme talon de la dissymtrie entre les deux parties dun dictionnaire bilingue ; abandonner et ses traductions en tant que verbe reprsentatif de la distributionnalit smantique (faible polysmie apparente, vaste champ synonymique en franais et paradigme de traductions trs important), ce verbe illustrant galement le rle important des collocations dans la slection des candidats ; la priphrase verbale se mettre pour mettre en avant que les auxiliaires et les priphrases aspectuelles fonctionnant morphologiquement comme des verbes ne peuvent pas tre occults dans notre modlisation ; les verbes de parole, ou plus exactement les verbes qui impliquent une composante explicite et obligatoire de communication verbale, pour montrer comment un corpus littraire remet en question les donnes strictement lexicographiques. Les analyses ainsi dtailles constituent les prmisses de la constitution des Champs Smantiques Multilingues Unifis (CSMU) dont le contenu et le fonctionnement seront prsents au Chapitre IV, aprs enrichissement par le corpus prcis au chapitre III et la fin de celui-ci. La mthodologie de base de ces Champs sera partiellement explicite la fin de ce chapitre ; elle sera accompagne de fragments des bases de donnes telles que celles-ci sont rellement saisies.
96

1.2 Quelques difficults surmonter


En premier lieu, un travail de constitution de bases de donnes propres suppose lemploi dun dictionnaire infaillible ou considr comme tel. En utilisant les dictionnaires bilingues comme ouvrages exclusifs de rfrence pour la construction de notre lexique, nous supposons quils ne contiennent pas derreurs. Dautre part, nous partons galement du principe quils sont exhaustifs ou au minimum reprsentatifs de lusage le plus frquent et le plus adapt. Bien sr, ce minimum est insuffisant au regard de nos principes mthodologiques de base, dont prcisment celui dexhaustivit mais rien ne nous empche dajouter ou de modifier des donnes en fonction des besoins. Ensuite, nous avons besoin dun dictionnaire jour, cest--dire qui tient compte de lvolution naturelle du lexique de chaque langue et par extension des changements qui interviennent entre les langues. Commencs il y a sept ans, nos travaux de rcupration de donnes ont partiellement subi lrosion du temps par la faute de cette volution du lexique. Plus encore que ce dernier, ce sont les dictionnaires publis qui prsentent normment de modifications dune dition lautre. Lun des arguments souvent voqus pour expliquer ces rapides changements est la ncessit de renouveler les donnes pour justifier des rditions quasi annuelles. Comme nous le rappelons au chapitre premier, lcueil de lobsolescence est la principale source de problmes en lexicographie, en particulier pour lactualisation de dictionnaires comme le TLF. Ce dernier est une immense source dinformations sur le lexique de lorigine du franais nos jours mais ptit presque de sa taille eu gard la ncessit de veille quil induit. Par surcrot, il sagit dun dictionnaire spcialis en littrature franaise et son enrichissement procde de fait dune exgse spcialise pratique par de vritables lexicographes. En ce qui concerne les LI, nous avions commenc lextraction des donnes partir de dictionnaires contemporains ou presque de la priode o nous les avons initis. Par la suite, nous nous sommes rendu compte que des dictionnaires plus rcents proposaient de profondes modifications par rapport leurs ditions antrieures ; les LI primitifs devenaient du mme coup en partie obsoltes mme si les changements en question ne remettent pas en cause notre mthodologie gnrale. Pour pallier cette donne nouvelle, nous avons complt et enrichi le LI franais-anglais partir dun dictionnaire de la mme dition plus rcent. Toutefois, il sagit dun travail considrable et il na pas t effectu pour les LI franais-espagnol et franais-italien, lesquels existent par consquent dans des versions non actualises bien que suffisamment rcentes pour tre reprsentatives. Heureusement, nous pouvons nuancer notre propos en reconnaissant que la majorit des donnes lexicales qui taient exactes il y a dix ou quinze ans le sont toujours aujourdhui. Dautre part, nous pouvons esprer que la probable numrisation
97

des dictionnaires bilingues permettra un jour prochain de construire automatiquement des LI, ne serait-ce que terme par terme, au lieu davoir les constituer manuellement comme nous lavons fait. Grce la mthodologie que nous allons dvelopper tout au long de ce document, les modifications pourront tre reportes directement dans la base de donnes sans ncessit aucune de repasser par une rcriture des LI. Sans vouloir anticiper sur les derniers chapitres, cette ractualisation facilite reprsente lobjectif principal que nous entendons atteindre.

2. Le lexique invers 2.1 Gense


Llaboration des Lexiques Inverss (LI) provient dune observation critique des dictionnaires bilingues abrgs et de notre faon de les consulter. Dordinaire, lorsque nous cherchons la traduction dun mot, et plus particulirement dun verbe polysmique, nous avons lhabitude de vrifier notre choix en consultant lentre du mot candidat dans lautre partie de louvrage. Cette mthode nous a rapidement permis de constater que les traductions dun mot ne proposent pas systmatiquement ce dernier en traduction lorsquil se retrouve en position de vedette. Par ailleurs, nous avons dcouvert dautres liens de traduction et de synonymie par ce biais. En effet, il apparat quil ny a jamais de symtrie entre les deux parties dun mme dictionnaire en ce qui concerne les units polysmiques, seuls les termes techniques chappant gnralement ce principe, mme si ce nest pas toujours le cas. En confrontant nos dictionnaires de rfrence leur reflet dans le miroir , nous parvenons rduire en partie les carences ventuelles de leur forme non biunivoque.

2.2 Construction des lexiques inverss (LI)


Tout lexique bilingue normalement constitu prsente deux parties distinctes, langue1 / langue2 et langue2 / langue1. Certains lecteurs pourraient croire quil existe une biunivocit systmatique entre les deux. Lexprience prouve que ce nest pas le cas et cest donc ce constat qui nous a donn lide dlaborer un lexique invers pour chaque partie de chaque dictionnaire bilingue. Dans cette optique, nous proposons 3 dictionnaires bilingues revisits pour les verbes : anglais / franais, italien / franais et espagnol / franais. Seul le manque de temps nous a empch den construire davantage, en particulier les LI avec le franais comme nouvelle langue source. Le principe gnral des LI ou lexiques miroirs est dcrire la partie Langue1 / Langue2 en nutilisant que la partie Langue2 / Langue1, et rciproquement. Pour ce faire, nous plaons en entre toutes les vedettes rencontres et nous faisons glisser les mots-sources correspondants en vedettes.
98

Nous allons expliciter la mthode laide de lexemple suivant qui reprend des fragments dentres de dcocher et lancer dans le dictionnaire franais-italien Bordas : Dcocher, V 154 scoccare( une flche )55 2 sferrare( un coup de pied ) 3 (fig) scoccare, lanciare Lancer, V 1 lanciare 2 gettare Entres inverses directement issues de la prcdente : gettare (1) = lancer lanciare (2) = dcocher (fig)-lancer scoccare (1) = dcocher( flche | fig) sferrare (1) = dcocher( coup de pied ) En vertu dun principe daccumulation, les nouvelles entres sont disposes accueillir dautres vedettes. Dans les lexiques que nous avons construits, le chiffre prcdant le signe = est le compteur non-automatique des vedettes. Le rsultat de lopration est la cration dun nouveau dictionnaire ou lexique italien / franais. Autrement dit, nous disposons de deux entres par mot de chacune des deux langues grce ce procd. Ds lors, il nous est possible de comparer les divergences entre les deux parties, comme lillustrent les exemples avec les verbes aborder, abandonner et traverser, et la priphrase se mettre , pour lesquels nous observons une forte dissymtrie entre le dictionnaire franais / langue-cible rel (que nous appelons droit ) et l'invers, le LI.

3. Exploitation des donnes des dictionnaires 3.1 Retour sur les principes dorigine
partir des rgles que nous venons de dcrire, le premier travail que nous proposons est deffectuer le relev dtaill des informations apparentes pour un lexme de chaque dictionnaire bilingue que nous utilisons. Lobjectif de ce
54

La numrotation correspond au dgroupement des acceptions tel quil apparat dans les dictionnaires bilingues de rfrence. 55 Les collocations habituelles, tout comme les informations lies au registre de langue, doivent apparatre dans un lexique complet tel que nous lenvisageons.
99

recensement est avant tout de rpertorier les lments essentiels pour un rapport de traduction complet , ainsi ventuellement que den isoler les critres non pertinents. Nous ferons merger lexhaustivit au travers dun relev minutieux. Au nom de la limpidit, la liste des informations nous obligera rflchir un mode de classement et de reprsentation clair. Les informations syntaxiques, smantiques et autres traits ncessaires au transfert nourriront les principes de valeur de transfert en gnral (y compris la sous-catgorisation). Enfin, nous dfendrons ltude du reflet du dictionnaire dans le miroir pour ajouter lexistant perceptible les informations dont lexistence est masque par leur emplacement dans la mauvaise partie du dictionnaire.

3.2 Dtail des entres dans nos dictionnaires de rfrence 3.2.1 Une entre du R&C franais-anglais
Lentre de to leave dans le Robert & Collins franais-anglais est prsente telle quelle, sans ajout ni omission daucune sorte. Chaque discriminateur sera relev une fois et une seule partir de cet extrait et nous en donnerons la description prcise :
leave56 /li:v/57 (vb58 : prt, ptp left59) VT60 a61 (= go away from62) [+ town63] quitter64, partir de65 ; (permanently66) quitter ; [+ room, building67] sortir de, quitter ;68 [+ person, job, ones husband, wife] quitter ; [+ ones children] abandonner he left Paris in 200169 il a quitt Paris en 200170 we left Paris at 6 oclock nous sommes partis de Paris or nous avons quitt Paris 6 heures () e (Math71) three from six ~s72 three six moins
56 57

Entre lexicale transcription phontique 58 catgorie grammaticale 59 formes flchies et/ou conjugues 60 indicateur de transitivit 61 marqueur de polysmie 62 quivalent en langue source 63 collocation objet 64 traduction en langue cible 65 double traduction en langue cible 66 information complmentaire pour la langue source 67 double collocation objet 68 changement de contexte langagier 69 syntagme ou phrase exemple 70 traduction du syntagme exemple
100

trois galent73 trois f (in will) [+ money] laisser {to 74} ; [+ object, property] laisser, lguer {to }75 VI (= go away) [person, train, ship etc]76 partir, sen aller ; (= resign) partir, dmissionner to ~ for Paris [person, train] partir pour77 Paris ; [ship] partir or appareiller78 pour Paris leave off79 VI (*80 = stop) sarrter where did we ~ off? (in work, reading81) o nous sommesnous arrts? ~ off ! arrte !, a suffit ! * VT SEP a (*= stop) arrter (doing sth de faire qch) leave out VT SEP82 a (= omit) (accidentally) oublier, omettre ; (deliberately) exclure ; [+ line in text] (also Mus)83 [+ note] sauter

Chaque lment constitutif des entres possde des caractristiques et des justifications que nous allons prsent dtailler : 1) Lexme Cest le lexme, le mot qui est traduit (ici leave). Dans les lexiques inverss, tous les lexmes se retrouvent en position de candidats des traductions proposes. 2) Forme phontique La forme phontique serait utile dans le cadre dun systme de comprhension par la reconnaissance vocale et est indispensable aux apprenants pour la juste prononciation des mots, mais cela ne fait pas partie de nos proccupations pour le prsent travail.

71 72

domaine demploi remplacement du mot source dans le texte 73 traduction en langue cible dans le syntagme exemple 74 constructions syntaxiques lies au contexte 75 idem que le point prcdent pour deux verbes en mme temps 76 collocations sujet 77 construction syntaxique supplmentaire 78 double traduction en langue cible dans les syntagmes exemples 79 verbe particule 80 marqueur de registre de langue 81 indicateur de situation dnonciation spcifique 82 sparation possible du verbe et de la prposition 83 marqueur dutilisation ventuelle dans un registre spcifique
101

3) Catgorie grammaticale La catgorie grammaticale est un critre essentiel pour la reconnaissance des units lexicales en contexte. Cest dautant plus vrai en anglais o de nombreux mots peuvent aussi bien tre noms, adjectifs ou verbes, sans marque affixale particulire. Cest notamment le cas de leave qui peut tre aussi bien un nom (= cong, permission, etc.) quun verbe dans sa forme lemmatique de base. La catgorie doit apparatre dans un graphe complet mais napparat pas forcment dans nos donnes car seuls les verbes y figurent, la valeur par dfaut tant donc V(erb). Toutefois, il peut arriver quun verbe soit traduit par une unit lexicale dune autre catgorie grammaticale, et vice-versa. Dans ce cas, la catgorie dviante devrait tre mentionne. 4) Formes conjugues Il sagit des formes conjugues particulires de lentre, en loccurrence le prtrit et le participe pass dun verbe anglais irrgulier. Cest un critre non utilis pour la construction du graphe, mais il serait ncessaire de limplanter en contrechamp pour une ventuelle application de nos lexiques des corpus (lemmatiseur). Remarquons qu linstar de la forme infinitive du verbe, les formes conjugues sont volontiers homographes de mots appartenant dautres catgories (left comme adjectif, par exemple). 5) Indicateur de transitivit Lindicateur de transitivit sert prciser si le verbe en entre est habituellement transitif ou intransitif ainsi que pour sparer les traductions des verbes qui peuvent tre les deux selon la norme. Ce trait nest pas reproduit tel quel dans notre base mais est tout de mme explicite : la prsence de collocations objet y indique que lon traite une forme transitive (avec une distinction entre la transitivit directe et indirecte, la bitransitivit cumulant les deux, la bitransitivit directe et la bitransitivit indirecte), leur absence dnote les formes intransitives. 6) Dgroupement typographique des traductions La numrotation est propre chaque dictionnaire pour dgrouper les paradigmes de traduction en fonction des acceptions de lentre. Ce dgroupement est assimilable au dgroupement polysmique ou homonymique selon le cas. 7) Synonyme en langue source Mot quivalent en langue-source de lentre dans un contexte linguistique donn. Apparat dans la colonne synonyme LangueSource gnrateur dun lien de synonymie entre ce terme et lentre.

102

8) Collocation objet apparente Collocation objet exprim dans la langue du mot vedette. Apparat dans une des colonnes collocations objet ; il est commun lentre et au mot traduit, bien que seulement exprim dans la langue source. 9) Traduction littrale Traduction de la vedette. 10) Concurrence de traductmes Prsence dau moins deux traductions en langue cible de la vedette dans des contextes linguistiques quivalents. 11) Informations complmentaires Information complmentaire dordre smantique portant sur la vedette et ayant une influence sur la traduction (le mot cible tant de son ct porteur de linformation leave permanently = quitter). 12) Concurrence de collocations objets Prsence dau moins deux collocations objet distinctes pour un mme paradigme de traductions. Ces collocations sont elles-mmes des classes (et non des fragments de discours littral) induisant des paradigmes lexicaux sous-jacents. 13) Marqueur typographique de changement de contexte langagier Le point-virgule indique quon passe un autre contexte langagier. Dont acte, il est important de ne pas confondre ce marqueur avec une virgule simple, laquelle est une disjonction qui indique que le contexte est le mme pour les traductions quelle spare. Virgule et point-virgule sont galement sparateurs pour dautres lments que les traductmes. 14) Syntagme exemple Syntagme exemple. Trs important car il peut faire apparatre dautres traductions, dautres collocations, de nouvelles constructions et dautres liens de synonymie en langue source ou en langue cible que ceux proposs prcdemment. Leur analyse oblige un travail de fourmi fastidieux mais ncessaire dans un souci dexhaustivit. 15) Traduction du syntagme exemple Traduction du syntagme exemple. Voir point 14 pour sa prise en compte. 16) Indicateur de domaine demploi Indicateur de domaine demploi : typographie presque identique aux infos complmentaires lexception de la majuscule initiale. Prsent dans la colonne
103

registre qui inclut le niveau de langue, le domaine demploi et ventuellement la zone gographique o lacception courante a cours. 17) Marqueur typographique de remplacement du mot source Le ~ sert remplacer la graphie littrale du mot source. Ressemble un pointeur sur une case-mmoire. 18) Nouvelle traduction Nouvelle traduction repre lintrieur de la traduction dun syntagmeexemple, lment ajout dans la colonne mot-cible , informations langagires ajoutes par ailleurs si elles sont reprables (collocations, constructions, etc.). 19) Constructions syntaxiques Constructions syntaxiques particulires associes lacception traite : si le verbe est transitif indirect, on ne fait apparatre que la prposition prcdant lobjet, lequel est prsent juste avant. Linformation portant sur la langue source est en premier et en italique ; la construction langue cible est en second en criture normal. 20) Constructions syntaxiques communes La construction en langue cible de cet exemple concerne les deux verbes candidats proposs. 21) Collocations sujet Collocations sujet ou restriction sur la slection smantique du sujet pour des emplois donns. Comme pour les objets, linformation est commune aux deux langues84 bien quil ne soit exprim quen langue source. 22) Construction syntaxique dans les syntagmes exemples Construction syntaxique particulire non prvue dans le paradigme de traductions principal. A reprer et ajouter le cas chant dans nos lexiques, si lon considre quil sagit dune forme syntaxique pertinente (i.e. frquente et/ou complment, par opposition aux circonstants). 23) Nouvelle traduction dans les syntagmes exemples Nouvelle traduction non prsente demble et mise au mme niveau quun autre terme-cible dans les syntagmes exemples.

84

Sauf avis contraire dans larticle du dictionnaire : les constructions peuvent tre inverses dune langue lautre (voir la diffrence entre manquer et to miss)
104

24) Verbe particule Verbe particule. Pour de nombreux verbes anglais, ces formes sont des lexies part entire et nous souhaitons les traiter comme telles au sein du graphe. Dans ce cas leave off fera peut-tre lobjet dun traitement diffrenci par rapport to leave en devenant un mot-source . 25) Marqueur typographique de niveau de langue Le * sert signaler un emploi familier, en loccurrence celui de leave off avec le sens de sarrter. Plus le nombre dtoiles est lev, plus lexpression est considre comme grossire. Peut faire lobjet dune colonne part, non prvue pour linstant, ou bien tre cod dans la colonne registre. 26) Information pragmatique Information pragmatique sur le contexte langagier, mme typographie que les domaines demploi ou les informations complmentaires de type adverbiales. On suppose quil peut tre implicite aussi bien quexplicite selon les circonstances. Utile lorsque le contexte dnonciation peut permettre de distinguer deux acceptions. 27) Verbes particule sparables et fusionns SEP indique que le verbe et la prposition sont sparables dans certaines constructions du verbe particule considr. Lorsque le verbe et la prposition ne sont pas sparables, le dictionnaire le mentionne par FUS (comme fusionn). Critre non rpertori mais important, tudier. 28) Domaines spcifiques supplmentaires Also est prsent pour prciser que la traduction gnrique propose sapplique galement un domaine spcifique, en loccurrence la musique. Dans ce cas, deux lignes de tableau sont ncessaires pour distinguer les collocations alors que la traduction reste la mme, car nous ne fusionnons pas demble les donnes demplois diffrents.

3.2.2 Une entre du Bordas franais-italien


lasciare85, v.t.86 1.87 lcher88: lasciami89!, lche-moi !; _90
le briglie, lcher les rnes ; _ la presa, lcher prise ; non lasciare il cane, ne lche pas le chien || ha lasciato
85 86

Entre lexicale (cf. 1 pour langlais) Marqueur de transitivit (cf. 5 pour langlais) 87 Indicateur de dgroupement (cf. 6 pour langlais) 88 Traduction (cf. 9 pour langlais) 89 Phrase exemple en langue cible suivie de sa traduction (cf. 14 et 15 pour langlais) 90 Le _ remplace le verbe en entre, afin dviter davoir le rpter (cf. 17 pour langlais)
105

tutto per dedicarsi alla letteratura, il a tout lch pour se consacrer la littrature || _ il gruppo, (ciclismo)91 lcher le peloton 2. (seguito da un infinito)92 laisser :

Le dictionnaire franais-italien Bordas prsente une structure plus rudimentaire que le Robert & Collins franais-anglais, lequel offre nettement plus dinformations et de variations typographiques pour les mettre en exergue. premire vue, la seule nuance typographique notable est lemploi de litalique pour tout ce qui concerne la langue source, du lexme aux marqueurs de registre, et dune typographie normale pour tout ce qui concerne la langue cible. Faute de plus de varit dans la manire de prsenter les rubriques, la consultation de ce dictionnaire est objectivement assez fatigante voire fastidieuse.

3.2.3 Une entre du Larousse franais-espagnol


dejar93 v. tr.94 Laisser95 : lo he dejado en casa96, je lai
laiss la maison ; le ha dejado algo por ou sin hacer, il vous a laiss quelque chose faire ; dejalo tranquilo, laisse-le tranquille ; dejar a uno el cuidado de, laisser quelquun le soin de ; dejar improductivo un capital, laisser dormir un capital. ||97 Dposer : dej a mi amigo en la estacin, jai dpos mon ami la gare. || Quitter : dejar a su mujer, quitter sa femme ; dejar un empleo, quitter sa place. || Laisser, abandonner : dejar a sus hijos, abandonner ses enfants. || Cesser, arrter : deja de trabajar a las seis, il arrte de travailler 6 heures ; dej de escribirme, il a cess de mcrire. || Rapporter : este negocio deja mucho dinero, cette affaire rapporte beaucoup dargent. || _ Dejad que los nios se acerquen a m, laissez venir moi les petits enfants. || FAM.98 Djalo !, laisse tomber ! | Djame en paz!, laisse-moi tranquille !, fiche-moi la paix ! || Dejar al descubierto, dcouvrir (un ejrcito)99. || dejar aparte, laisser de ct. || FIG. Dejar a salvo,
91 92

Marqueur de domaine Information grammaticale, construction particulire (cf. 19 pour langlais) 93 Entre lexicale (cf. 1 pour langlais) 94 Marqueur de transitivit (cf. 5 pour langlais) 95 Traduction (cf. 9 pour langlais) 96 Phrase exemple en langue cible suivie de sa traduction (cf. 14 et 15 pour langlais) 97 Indicateur de dgroupement (cf. 6 pour langlais) 98 Marqueur de registre (cf. 16 et 28 pour langlais) 99 Collocation objet (cf. 8 pour langlais)
106

faire abstraction de. || Dejar atrs, laisser en arrire, lcher, distancer. || Dejar a un lado ou de lado, laisser de ct. || FIG. Dejar caer, glisser : dej caer el la conversacin que quera irse a Espaa, il glissa dans la conversation quil voulait partir en Espagne. || Dejar como nuevo, remettre neuf (una cosa), remettre (una persona). || Dejar correr, laisser faire, laisser courir. || FAM. Dejar chiquito

Dans le Larousse franais-espagnol, laccent est surtout mis sur les traductions du terme source ainsi que sur la varit des locutions et expressions o celui-ci figure. Les entres de ce dictionnaire donnent peu dinformations sur les collocations et de ce fait ne permettent pas de manire claire dassocier directement chaque groupe de traductmes lacception considre, hormis en faisant des infrences sur la relation synonymique entre dventuelles traductions communes pour une mme acception de la vedette. La typographie utilise est presque la mme que pour le Bordas, seule la distinction italique / pas italique tant utilise pour sparer visuellement les informations.

4. Un exemple flagrant de dissymtrie : les traductions du verbe aborder en italien 4.1 Prparation franaise du verbe, pour aborder aborder 4.1.1 Double nominalisation : abord et abordage
Dans des travaux anciens (Haton, 1999), nous tentions dvaluer le degr dloignement des sens littraux et mtaphoriques de certains verbes, dont celui qui nous occupe dans le prsent chapitre. En vertu du principe nonc par Todorov (1967), nous entendons plutt donner cette problmatique une rponse synchronique , ce qui nexclura pas de rechercher dans lhistoire de ce verbe quelques lments de rflexion. Considrons tout dabord les substantifs dverbaux associs aborder : 31) Labordage du navire a t difficile 32) *Labordage du problme a t difficile 33) *Ce navire a eu un abord facile 34) Ce problme est dun abord facile Ces exemples semblent montrer que le verbe aborder se nominalise par abordage dans son sens littral tandis quil admet seulement abord comme quivalent
107

nominal dans son acceptation mtaphorique. Ce constat immdiat remet apparemment en cause un des facteurs premiers de la polysmie, savoir le lien fort de parent entre les diffrentes acceptions dun mme terme, ainsi que la mise en commun des termes drivs (substantifs, adjectifs, etc.). Pourtant, les sens mtaphoriques et non mtaphoriques de ce verbe sont tymologiquement corrls, les premiers ayant un jour dcoul des seconds. Un petit tour par la diachronie nest donc pas compltement superflu pour essayer de comprendre la polysmie de ce verbe en synchronie. Lhypothse tymologique intuitive selon laquelle abordage est la premire nominalisation du verbe aborder en tant que terme maritime (son emploi initial), puis que le nom abord a t choisi par la suite pour caractriser les emplois mtaphoriques ne tient pas selon nos sources. En effet, abord est apparu au 15me sicle, 85 ans avant abordage, comme nominalisation du sens de fait davoir accs une personne . Aujourdhui, abord est dsuet dans ses acceptions de action daborder au rivage , alors que abordage na jamais servi dans le sens mtaphorique. Abordage dans le TLF
1553 action d'entrer dans un port (d'un navire) terme mar. (P. BELON, Observations, III, 13 ds R. Philol. fr., XLIII, 174 : Les juifs ... mettent de plus haut pris la recepte du revenu des provinces, affermans les gabelles, et l'abordage des navires et autres choses de Turquie); 1616-20 id. , id. (D'AUBIGN, Hist., II, 179 ds LITTR : Les Rochellois, ds l'abordage [des navires], se jettent sur le pont de corde); 2. 1660 assaut donn un navire dans un combat id. (CLEIRAC, Explic. termes mar., 53 ds JAL2 : On distingue l'abordage de franc-table (peron contre peron), l'abordage en belle (peron contre flanc)); 3. 1687 collision volontaire ou non de 2 navires id. (CHOISY, Voy. de Siam, 141, ibid. : Cependant il [le navire] arrivoit sur nous, et nous alloit aborder bbord... on a donn un coup de gouvernail pour viter l'abordage). Dr. de aborder* : 1 de aborder 2, terme mar.; 2 et 3 de aborder 1, terme mar.; suff. -age*.

Abord dans le TLF


a) 1440-1475 fait d'avoir accs une personne (CHASTELLAIN, Chron., IV, 379, d. Kervyn ds R. Hist. litt. Fr. I, 180 : Tandis doncques que ces anglois estoient devers le duc besognant pour leur premier abord); 1611 accueil fait par la personne aborde (COTGR. s.v. abord : De doux abord. Gentle, courteous, affable : of open accesse, easie to be spoken with, or come into); b) 1636 attaque (CORNEILLE, Cid. 1087 ds DUB.-LAG. 1960 : De ces vieux ennemis va soutenir l'abord), d'o 1575 de premier abord ds le commencement (MARG. DE FRANCE, Mm. ds D G : De premier abord, l'effroy l'ayant pris); 1607 d'abord id. (HULSIUS, Dict. fr.-all.); 2. 1616-1620 action d'arriver en un lieu (D'AUBIGN, Hist., II, 183 ds LITTR : Il vint la cour en poste, et deux heures aprs son abord, Pellicar, ...); 3. a) ca 1530 lieu (o l'on est arriv)
108

(C. BUCHER, Posies, d. Denais, 87 ds R. Hist. litt. Fr., I, 180 : Que cerches-tu ores en ces abords?); 1556 lieu o l'on aborde, port terme mar. (SALIAT, Trad. d'Hrodote, d. chez E. Groulleau, III, 5 ds HUG. : Plusieurs ports et abords de mer ou se fait grand trafic); b) XVIe s. abords rive le long d'un cours d'eau terme mar. (Cout. de L'Angle, Nouv. Cout. gn. I, 312 ds LACURNE, t. 1, 1875 : Est ordonn... a un chascun ayans abords contre la grande rivire... qu'ils ayent les entretenir). Dv. de aborder* : 1 a de aborder 3; 1 b de aborder 1; 2 et 3 a de aborder 2; 3 b dr. de bord* 2 b. HISTORIQUE I. Hist. des sens. A. fait d'avoir accs auprs d'une pers. , 1re attest. 1440-75 (cf. tymol.) et attest surtout dans les accept. suiv. : 1. possibilit d'avoir accs auprs d'une pers. , apparat ds Ac. 1718 et se trouve durant toute notre priode; 2. accueil, aspect de la pers. aborde , 1re attest. 1611 (cf. tymol.) et constamment attest. B. lieu o l'on est arriv , attest en 1530 (cf. tymol.), sans attest. post., sinon dans les accept. suiv. : 1. lieu o l'on aborde, port , attest en 1556 (cf. tymol.) et encore en 1610 : Le Roy... le comble [l'hermitage d'Honneur] de toutes les singularitez dont il se peut aviser, l'ayant fait un abord de toutes sortes de gens d'honneur. BEROALDE DE VERVILLE, Voyage des Princes fortunez, 322 (Hug.). Pas d'attest. jusqu'en 1908, o cette accept. reparat dans un emploi plus restreint (cf. ex. 6); 2. rive le long d'un cours d'eau , attest au XVIe s. Qq. rares attest. jusqu'au dbut du XIXe s. (peut-tre ds ex. 2). C. arrive en un lieu , 1re attest. 1616-1620 (cf. tymol.). En ce sens gn., abord aurait pu prendre la place d'un autre mot, arrive, de mme orig. mar., mais il est condamn comme vieilli au XVIIIe s. (cf. BRUNOT t. 6, pp. 1335-1336; cf. galement BESCH. 1845, s.v.), est relay par certaines accept. partic. : 1. fig. action d'aborder une entreprise , not ds Ac. Compl. 1842 (le commencement d'une action), et qui possde qq. attest. au e e XX s., mais qui se trouve dj dans les loc. apparues ds la fin du XVI s. : de premier abord, 1575; d'abord, 1607 (cf. tymol.); 2. noter, de mme que pour les pers., la nuance entre le fait et la possibilit : possibilit d'accder un lieu, spc. par mer , 1re attest. ds FUR. 1690 et attest durant toute la priode; 3. p. ext. arrive massive, affluence , 1re attest. 1687 : Les autres n'taient que des hteliers que le grand abord des trangers enrichissait. re FONTENELLE, Orac., I, 14 (Littr). Attest dans les dict. jusqu' la 1 moiti du e XIX s. Not vieilli ds Ac. 1835 et BESCH. 1845; 4. prsence , de 1701 (FUR.) 1832 (cf. ex. 15); 5. lieu par o l'on accde , ds FUR. 1701; attest. constantes et avec plus d'ext. dep. BESCH. 1845 environs ; 6. action d'aborder une cte , apparat ds Ac. 1798 et constamment attest. D. attaque par terre ou par mer . Apparat en 1636 (cf. tymol.). Bien attest jusqu' la fin du e XVIII s. (cf. ex. 23), encore attest en 1837. Pas d'attest. post. II. Vitalit des sens. A. Sens et accept. disparus : 1. av. 1789 : nant; 2. apr. 1789 : le sens B dans sa totalit; le sens C dans ses accept. 3 et 4; le sens D (sous rserve de certains emplois de loc.). B. La vitalit des sens et accept. restants n'est rien en compar. de celle des loc. (notamment d'abord) o se manifeste surtout l'accept. C 1 (cf. sm.).
109

Cette situation paradoxale dun verbe double nominalisation semble indiquer que les deux substantifs en concurrence sont moins smantiquement loigns quil ny parat. Or, la (sur)vie du second (abord) pour dsigner laction de rentrer au port na pas excd deux occurrences (voir ci-dessus), si lon excepte quelques rsurgences la fin du 19me sicle. En ralit, la distinction de sens na pas eu lieu entre le terme concret et le terme mtaphorique, mais plutt entre les deux sens littraux du verbe : Abordage se rapporte laction de se mettre au bord dun rivage ou bord bord avec un autre navire. Abord nominalise prfrentiellement le fait dtre au bord du rivage ou davoir accs une personne. Ce qui les distingue manifestement est la diffrence entre laction et ltat, le second ayant vu ses emplois stendre mtaphoriquement laction de dbuter quelque chose . Aspectuellement parlant, labordage est un climax100 et on peut parler dachvement pour le caractriser ; abord renvoie un tat dans ses acceptions premires et possde un aspect ingressif101 pour son emploi mtaphorique. Cette non-concurrence sous forme de divergence lexicale est certainement le fait du hasard de lvolution du franais. Rien dans lhistorique complexe que nous avons prsent ne semble expliquer un tel dgroupement, hormis peut-tre les divergences aspectuelles que nous venons de dcrire. Et par consquent, rien ne justifie rellement de traiter les diffrents sens de ce verbe comme de vritables homonymes. En revanche, la distinction est dimportance pour lavenir si nous dcidons dinclure les prdicats substantifs nos modles. En tant que dverbaux tous les deux, abord et abordage oprent une opposition de facto entre les diffrents sens du verbe aborder auxquels ils se rapportent. La question est de savoir si nous associerons systmatiquement les substantifs aux verbes dans le graphe ou sils feront lobjet dentres autonomes. Dans le premier cas, aborder ferait lobjet dune sparation entre ses deux ensembles dacceptions lis aux substantifs.

4.1.2 Forte polysmie


Dans notre terminologie, la polysmie dun verbe est dite forte lorsquil est devenu difficile de faire un rapprochement conceptuel entre ses diffrentes acceptions, quels que fussent les liens historiques entre ces dernires. Il conviendrait dans ce cas

100

Cest--dire le point culminant dune action quon peut considrer comme acheve lorsquil est atteint. 101 Laspect ingressif correspond la priode qui prcde de peu ou initie le procs dnot par le verbe (voir Cosriu 1979, Laca 2004).
110

de parler dhomonymie synchronique, cette nuance terminologique expliquant pourquoi la polysmie est forte . Entre certains des divers sens du verbe aborder, il ne subsiste plus quun lien tnu quil est possible de capter par lintuition, mais quil nest apparemment plus possible de verbaliser par une primitive smantique. Ainsi, aborder un problme et aborder le/au rivage nous paraissent avoir conserv une proximit smantique sans que nous puissions la dcrire autrement que par une paraphrase maladroite : venir/arriver au bord de , paraphrase qui dailleurs ne rsout pas le problme du dcalage entre le sens littral et la mtaphore puisque venir et arriver peuvent tous deux tre employs mtaphoriquement. En loccurrence, le bord dun problme, dun thme ou dune question renvoie au commencement du traitement de ceux-ci, alors que le bord du rivage est le rivage lui-mme102. Dautre part, la distinction entre les deux substantifs associs aborder accentue encore davantage la sensation de distance entre les acceptions. Consquemment, nous conservons au verbe aborder le statut de terme polysmique, en tant quunit homographique de catgorie constante (verbe) et origine commune. Toutefois, nous suggrons de le faire entrer dans la catgorie des verbes forte polysmie , sous rserve de la pertinence de crer cette dernire dans loptique de construire des graphes. Le relev des traductions de aborder en italien confirme partiellement ce point de vue en prsentant des vedettes diffrentes pour les sens les plus loigns comme nous allons le montrer maintenant.

4.1.3 Dgroupement des acceptions


Nous allons illustrer notre propos initial au sujet de la dissymtrie par ltude des traductions proposes pour le verbe aborder en italien. Cet exemple est le premier que nous avons commenc traiter dans lordre chronologique, il y a six ans, et nous le rutilisons aujourdhui car il illustre parfaitement le phnomne. Afin de prsenter clairement les deux lexiques et de les comparer efficacement, nous avons utilis les dfinitions du verbe aborder tires du dictionnaire Larousse de langue franaise103, et nous les avons synthtises : 1- arriver au rivage ([intransitif]) 2- approcher de (quelquun (pour lui parler))104

102

Cette diffrence a encore voir avec laspect du verbe, achvement dans un cas, ingressif dans lautre. 103 Nous navons pas utilis ici les ressources du TLF. Le dgroupement effectu par ce dernier est dune grande richesse, bien suprieure ce que les autres dictionnaires monolingues ou bilingues sont en mesure de proposer. Cest donc avant tout par souci de simplification quun autre dictionnaire de rfrence a t choisi pour illustrer notre propos.
111

3a- arriver (un lieu) 3b- en venir traiter (problme-question) 3c-commencer tudier (matire) 4a-accoster (un navire (pour lassaillir)) 4b-heurter (un navire (par accident)) 5-prendre (virage) 6-attaquer (un ennemi) 7-saborder : entrer en collision (pour deux navires) Nous ne conserverons pour la suite que les indices figurant au dbut des lignes prcdentes.

4.2 Traductions 4.2.1 Illustration de la dissymtrie dans les lexiques franais-italien


Voici maintenant nos deux entres du verbe aborder, la premire tant celle du dictionnaire Bordas franais-italien et la deuxime tant celle du lexique invers constitu partir de la partie italien-franais du mme dictionnaire. Pour le LD comme pour le LI, les traductions ont t classes ci-dessous en fonction de lacception daborder auxquelles elles correspondent : Lexique droit (LD) 1-attraccare, approdare, sbarcare (exemple105) 2-fermare (exemple) 3a-approdare (exemple) 3b-abbordare,affrontare (exemple) 3c 4106-abbordare (exemple), arrembare
104

La dfinition sous forme de paraphrase verbale est en gras, lobjet prototypique est propos en italique, ventuellement accompagn dune extension en criture normale qui dcrit la situation dnonciation. 105 Lorsque la traduction est accompagne dun syntagme ou dune phrase exemple, nous le mentionnons avec la marque exemple. Quand aucun exemple nest associ une traduction, nous avons d dduire par nous-mme le rapport traductmeacception ; cela na pas t trop difficile pour cette entre car attraccare et approdare sont proposs pour lemploi intransitif du verbe (acception 1 uniquement), entrare in collisione nest valable que pour la forme pronominale (acception 7) et arrembare est propos pour lacception 4 au mme niveau que abbordare qui lui est muni dune phrase exemple. 106 Nous navons pas trouv de distinction dans le dictionnaire bilingue entre les traductions des acceptions 4a et 4b, cest pourquoi nous les avons fusionnes ici.
112

5-prendere (exemple) 6-attaccare (exemple) 7-entrare in collisione Lexique invers (LI) 1-accostare (attraccare107), affiancare (v.accostare108), approdare, arrembare 2-abbordare (avvicinare), accostare (personne), appressare (deriv letter 109 per avvicinare), appropinquare (letter ant per avvicinare), avvicinare (una persona) 3a 3b-abbordare (affrontare), accennare110, affrontare 3c-accostarsi a 4-abbordare, arrembare 5-abbordare 6111 7 Nous allons maintenant effectuer deux reprsentations comparatives des deux lexiques afin den extraire les diffrences et les points communs. Le premier graphique est constitu de trois colonnes, la premire est la liste ordonne des vedettes du LD, la seconde contient les indices des sens du verbe aborder en franais tels quils sont dfinis ci-dessus et la troisime contient la liste ordonne des vedettes du LI. Le principe consiste mettre en relation les diffrentes traductions du verbe aborder avec les acceptions auxquelles elles correspondent.

Attraccare nest pas explicitement traduit par aborder pour cette acception mais on le retrouve mentionn comme synonyme proche de accostare lentre de ce dernier quand il est lui-mme traduit par aborder. Dans les bases de donnes que nous avons finalement constitues, le verbe attraccare possde un statut particulier de traduction indirecte ou plus exactement de synonyme en langue cible de aborder via accostare. 108 v.accostare signifie quon a un renvoi vers accostare depuis affiancare, celui-ci ntant pas directement traduit par aborder sa propre entre. 109 Marques de registre (letter pour littraire, ant pour vieux) 110 Dans certains cas, il faut penser aux influences des sens premiers du terme sur la traduction du mot-cible propos. Ici, accennare en tant que transitif direct signifie baucher ou esquisser. Cest par analogie quil pourrait tre traduit par aborder dans un contexte trs prcis. 111 Labsence de verbes traduits par aborder dans certaines acceptions est caractristique des dcalages que nous avons observs dans les dictionnaires bilingues. La lacune la plus frquente concerne les verbes pronominaux franais, lesquels font trop rarement office de traductions dans la partie inverse du dictionnaire.
113

107

La seconde figure comporte la base les mmes informations que la premire mais elle fait ressortir plus nettement la dissymtrie dont nous avons dj parl. Il sagit dun tableau quatre colonnes o chaque ligne concerne un (et un seul) verbe italien. Les cases vides correspondent ainsi aux verbes qui napparaissent que dans un des deux lexiques. Plus exactement, les cases vides indiquent que le verbe apparat dans lautre lexique mais pas dans celui-l. La cinquime colonne a t tablie partir des traductions les plus proches du verbe aborder pour les verbes prsents dans le LD et pas dans le LI. Sous cette forme, le processus de recherche de symtrie nest pas correctement rendu. Cest pourquoi nous proposons une autre reprsentation sous forme de tableau, en rtablissant en vis--vis, de part et dautre des indices de sens, les verbes italiens identiques, quils soient ou non illustrs par un ou plusieurs candidats la traduction.

114

Figure 3 : Graphique rcapitulatif, seconde version. Mise en exergue de la dissymtrie

Traductions dans le LD abbordare accennare accostare accostarsi a affiancare affrontare appressare approdare appropinquare arrembare attaccare attraccare avvicinare entrare in collisione fermare prendere sbarcare

Indices des sens daborder

Traductions dans le LI abbordare

1 2 3a 3b 3c 4

accennare accostare accostarsi a affiancare affrontare appressare approdare

5 6

appropinquare arrembare attaccare attraccare

avvicinare entrare in collisione fermare prendere sbarcare

Trs nette dans ce dernier schma, la dissymtrie globale entre le LD et le LI est galement plus directement accessible dans le tableau suivant, lequel met en valeur les dcalages par acceptions.
115

Figure 4 : Tableau rcapitulatif du verbe aborder

Dico droit abbordare

Indice T1 Indice T2 Dico invers 3b-4 2-3b-4-5 3b 1-2 3c 1 3b 2(litt) 1 2(litt,ant) 1-4 abbordare accennare accostare accostarsi a affiancare affrontare appressare approdare appropinquar arrembare

Traduction prfrentielle
112

Traduction inverse du sens proche113

affrontare approdare arrembare attaccare attraccare entrare in collisione fermare prendere sbarcare

3b 1-3 4 6 1 7 2 5 1

attaquer accoster 2 avvicinare


entrer en collision

attaccare attraccare
entrare in collisione ; scontrarsi

arrter prendre dbarquer

fermare prendere sbarcare

Quelques observations simposent : Flagrante dissymtrie : Ce travail comparatif nous permet dobserver une forte dissymtrie dans la reprsentation des vedettes, mme en ignorant leur rpartition par acception. Cinq vedettes du LD napparaissent pas dans le LI (attaccare, attraccare, fermare, prendere, sbarcare) et sept vedettes du LI ne sont pas prsentes dans le LD (accennare, accostare, accostarsi a, affiancare, appressare, appropinquare, avvicinare). Seulement quatre vedettes (sur seize) sont communes aux deux lexiques (abbordare, affrontare, approdare, arrembare). la lecture de nos rsultats, il nous parat dsormais vident, voire logique, quune dissymtrie plus ou moins importante
112

Lorsquun autre verbe que aborder traduit mieux que celui-ci le verbe italien plac en entre, il est prcis dans cette colonne sous la mention traduction prfrentielle . 113 Bien entendu, la traduction inverse du sens proche est dans la grande majorit des cas le verbe italien dorigine. Il faut comprendre par-l que la traduction prfrentielle du verbe italien est prfrable aborder dans le contexte appropri.
116

est invitable entre les deux parties dun dictionnaire bilingue. Toutefois, lampleur du phnomne sur cet exemple dpasse nos attentes en la matire. Cest pourquoi il serait sans doute ncessaire de complter cette analyse par la consultation systmatique dun dictionnaire monolingue italien (ou anglais ou espagnol pour dautres cas) afin de dterminer la validit des hypothses et des remarques induites par notre tude. La premire hypothse pertinente est la confirmation de la validit des quatre vedettes communes comme traductions daborder. En apparaissant deux fois, elles semblent constituer une espce de noyau dur infrangible dans loptique dune fusion filtre des deux lexiques. De la dissymtrie dans la symtrie : Nous notons une dissymtrie moins marque concernant la rpartition des sens pour les vedettes communes aux deux lexiques. Ainsi, le LI montre que abbordare est une traduction probablement plus complte du verbe aborder que ne le laisse apparatre le LD (cinq acceptions contre trois pour le second). Ceci tend prouver quabbordare nest pas systmatiquement prioritaire pour toutes les acceptions du verbe franais mme sil en est une traduction possible. Cette seconde observation vient un peu nuancer la premire. Elle ne constitue pas pour autant une remise en cause assez pertinente du principe du noyau dur dans la mesure o cette dissymtrie nest que partielle et offre plus de complments dinformations que de contradictions. Ici encore, cest le dictionnaire monolingue qui nous fournirait la meilleure rponse. Dissymtrie cache : Il existe de grosses diffrences dans les traductions proposes pour chacun des sens du verbe aborder. Les acceptions 1 et 2 en particulier font apparatre les plus grosses diffrences en ce domaine (voir la premire page de ltude daborder). Notre troisime observation mrite quelques commentaires qui dpassent le cadre de cette prsentation sommaire. Le relev de la dissymtrie se passe de commentaires. propos du sens 5 prendre (un virage) le dictionnaire nous offre prendere comme traduction exclusive. Or la traduction de prendere dans cette acception est prendre comme on pouvait sy attendre. Cest abbordare qui figure dans le LI pour le sens 5 alors que le LD ne le mentionne pas. Dans ce cas prcis, nous pensons que cest le LI qui a raison car laction daborder un virage (ou une courbe, un carrefour) comporte des traits smantiques (prudence, danger) qui ne sont pas inclus dans la structure de traits de prendre ou de prendere, celui-ci tant plutt considrer comme une traduction gnrique non marque smantiquement. Pour
117

cette dernire raison, il est ncessaire daugmenter la structure de traits aussi bien pour le LD, pour dterminer toutes les paraphrases du motsource, que pour le LI au sein duquel on souhaite reprer une hirarchie de slection entre les diffrentes vedettes. Un cas de symtrie trs isol : Il est notable quune seule vritable symtrie est perceptible dans ce relev concernant la traduction affrontare, qui est la seule dont la prsence conjointe aux deux lexiques saccompagne dune rpartition commune des sens qui lui sont attachs, du sens unique 3b en loccurrence. Mme en prenant en considration que la dissymtrie lexicographique est une donne invitable, cet unique cas de correspondance dans le miroir parat bien isol. Bien entendu, affrontare est confirm comme vedette daborder en raison de son appartenance aux deux lexiques, le Droit et lInvers. La parasynonymie dans la traduction : extension de sens ou zle des rdacteurs ? : Parmi toutes les traductions, nous relevons une incohrence apparente avec la prsence de sbarcare comme traduction possible du verbe aborder au sens 1 alors que le LI ne propose que la traduction proche dbarquer (aprs avoir abord114). Or, il semble que le LD ait nglig ce trait en ne mentionnant pas que sbarcare ne semploie pas pour la seule action de toucher au rivage. Nous parlons dincohrence, voire derreur, dans la mesure o labordage est un prsuppos de laction de dbarquer mais nen est pas le synonyme. Cette remarque sinscrit dans une rflexion plus gnrale sur les limitations ncessaires imposes de facto aux dictionnaires concernant le format et la somme dinformations quon peut y mettre. Il est possible que sbarcare ait t mentionn comme extension du sens daborder pour montrer que laction de toucher au rivage pour un navire saccompagne gnralement de laction de dbarquer pour les personnes qui taient son bord. Si tel est le cas, le dictionnaire devrait mentionner ce fait en prcisant quil sagit dun emploi mtonymique avec extension du sens par implication (labordage implique le dbarquement). En ralit, il est acceptable de considrer labordage comme une consquence implicite du sens premier de sbarcare. On pntre ainsi dans le prilleux territoire de la smantique pragmatique qui est rarement compatible avec le format trs synthtique dun dictionnaire.

114

Trait ajout par nous, non apparent dans le dictionnaire


118

Dissymtrie dans les acceptions disponibles : Chaque partie du dictionnaire bilingue ne donne pas de liste de traductions exhaustive. Dautre part, de nouveaux sens mergent par rapport aux dictionnaires monolingues. Remarquons la disparition ou lapparition de sens possible du verbe aborder en fonction des vedettes proposes. Le LI ne propose aucune traduction pour le sens 6 (attaquer (un ennemi)) ni le LD pour le sens 3c (commencer traiter (une nouvelle matire)). Les sens 3c et 6 daborder ne figurent pas (explicitement) dans le dictionnaire franais Larousse sur lequel nous nous sommes appuy. Ils nen sont pas moins pris en compte par le dictionnaire franais / italien. Comme il sagit apparemment de sens faibles, il nest pas surprenant de constater quils napparaissent que dans un seul lexique. Lentre dattaccare dans le LD italien / franais a en vedettes les verbes attaquer ou affronter qui sont des traductions plus littrales et plus courantes quaborder qui est rsiduel dans cette acception. Le sens 3c est plus intimement li dautres acceptions du verbe aborder, il fait donc moins office de bruit dans la liste des traductions proposes. Vaste paradigme de traduction : Nous pouvons tre surpris par le grand nombre de candidats recenss une fois le LD et le LI unifis. Lunion des deux lexiques nous en offre seize diffrents (dont neuf pour le LD, onze pour le LI et quatre pour lintersection des deux). Laspect comptable de ce travail ne doit pas nous amener une vision accumulative ni restrictive de la lexicographie bilingue. Ni lunion ni lintersection des deux lexiques ne nous offrent un rsultat satisfaisant dans la perspective dune rcriture de lentre daborder. Pour optimiser celle-ci, nous envisageons de raliser une fusion filtre issue de nos remarques, de la prise en compte de facteurs plus fins que ceux apparents (degrs smantiques, registres de langue, cohrence, complmentation, etc.) et de la consultation dun lexique italien que nous mentionnons plus haut. Toutefois, cest dabord lunion des lexiques que nous exploiterons dans les CSMU.

119

5. De la polysmie faible lexplosion combinatoire : le verbe abandonner 5.1 Polysmie faible 5.1.1 Un fort lien smantique entre acceptions
Pour caractriser le degr de polysmie des verbes dune langue, il est tentant dexplorer la reprsentation par primitives conceptuelles et de vrifier dans quelle mesure les diffrents sens de chaque verbe peuvent tre regroups sous la mme primitive. Si nous parvenons esquisser cette dernire, le verbe analys pourra tre considr comme faiblement polysmique car tous ses sens seront corrls, condition que les traductions le confirment par leur nombre important et la finesse des critres qui permettent de les distinguer les unes des autres. Ceci se rapproche de la notion de polysmie verticale dans la mesure o la primitive englobe toutes les acceptions, comme nous lvoquions au Chapitre I. Lobjectif est de crer un label formalis et englobant de classes de prdicats. Pour le champ smantique de labandon sur lequel nous avons travaill, la primitive utilise pourrait tre : Il existe x, y et z tels que : x cause (ou fait), volontairement ou sous la contrainte, que nexiste plus (ou cesse) un lien privilgi z entre luimme et un objet y115, ce dernier tant exprim ou non au moyen du langage116. Le rsultat est larrt du processus y (quand y est un processus) ou ltat dabandon de y (quand y nest pas un processus). Une fois formalis, nous aurions : x, y, z, Exister_lien (z,x,y) [tat initial], Causer (x,z) [processus], z [rsultat]117.

Objet est prendre ici au sens syntaxique Largument en position objet peut faire lobjet dune ellipse comme dans les exemples suivants : Jabandonne (la partie, je nen peux plus), je renonce ( texpliquer, tu es vraiment trop bouch), je laisse (les enchres monter sans moi). On peut noter que les diffrents prdicats du champ nont pas le mme comportement face lellipse ; si celle-ci parat naturelle en contexte pour abandonner ou renoncer, elle est dj moins immdiate pour laisser, quitter hormis dans des emplois trs prcis (jeu pour le premier, session informatique pour le second) et devient mme douteuse pour cesser, mme en emploi absolu : ?? Je cesse. 117 Formalisme auquel il conviendrait dajouter des marqueurs pour exprimer lintensit du lien, sa nature ainsi que les notions de volont du sujet ou dexpression langagire de lobjet (i.e. ellipse ou pas ellipse).
116

115

120

En primitive lexicalise, cela pourrait donner causer que nexiste plus un lien entre le sujet et lobjet .(4) En ce qui concerne le verbe abandonner, les divergences de sens ne sont pas rechercher seulement dans les acceptions elles-mmes, mais galement dans lenvironnement langagier du prdicat en contexte. Nous considrons que les primitives sont beaucoup moins sensibles linadquation interlangue que les units lexicales. Par consquent, il nous parat possible de les crire dans une langue donne et de les appliquer toutes les autres langues.

5.1.2 Pas de dgroupement de substantifs


Abandonner admet un et un seul substantif dans sa forme dverbale, savoir abandon. Ce dernier est utilisable pour toutes les acceptions du verbe, y compris les formes pronominales et les emplois mtaphoriques. Si le noyau de sens est commun toutes les acceptions, les nuances sont rechercher prioritairement dans les collocations. Le dgroupement que nous prsentons dans le tableau rcapitulatif est entirement motiv par les objets (tous directs) que le verbe prend en fonction des traductions proposes. Vu sous cet angle, abandonner est circonscrit une seule acception principale, que nous rsumons par la primitive labore au sous-chapitre prcdent.

5.2 Un champ lexical large 5.2.1 Constitution du champ lexical de abandonner en franais
5.2.1.1 Mthode dextraction des synonymes et quasi-synonymes La rcupration des donnes lexicographiques (TLF, Robert, fusion des dictionnaires de synonymes, dictionnaires monolingues et bilingues, etc.) nous donne les paradigmes lexicaux suivants pour le champ smantique de labandon (prdicats verbaux uniquement). La liste suivante est globalement issue de la fusion des dictionnaires de synonymes de lINALF exploite par ailleurs :
abdiquer, abjurer, abolir, accorder, adieu, aliner, apostasier, balancer, bazarder, caler, caner, capituler, cder, cesser, concder, confier, dguerpir, dlaisser, dloger, dmissionner, dmordre, dmnager, dposer, dpouiller, dserter, dteler, dtourner, disparatre, donner, enterrer, vacuer, exposer (anc), finir, flancher, flchir, fuir, immoler, interrompre, jeter, lcher, laisser, larguer, lguer, liquider, livrer, mourir, ngliger, omettre, oublier, partir,
121

plaquer, plier, poser, quitter, rabattre, raccrocher, reculer, rejeter, relcher, relguer, remettre, renier, renoncer, repousser, rpudier, rsigner, rsilier, rompre, sloigner, s'enfuir, s'incliner, sacrifier, se dbarrasser, se dfaire, se dmettre, se dpartir, se dpossder, se dpouiller, se dsintresser de, se dsister, se dsolidariser, se dessaisir, se dtacher, se dtacher de, se livrer, se rendre, se replier, se retirer, se sparer, se sparer de, se soumettre, semer, sortir, succomber, supprimer, suspendre, tomber, vider, violer, baisser les bras, baisser pavillon, battre en retraite, couper l, dclarer forfait, faire cesser, faire la part du feu, fausser compagnie, jeter le manche aprs la cogne, lcher pied, laisser aller vau-leau, laisser aller, laisser choir, laisser courir, laisser de ct, laisser pricliter, laisser tomber, laisser traner, mettre bas, mettre les pouces, passer la main, planter l, plier bagage, renier sa foi, savouer vaincu, sen aller, se laisser dpossder de, tourner le dos , vider la place, vider les lieux

Nous notons en premier lieu la prsence ventuelle de verbes polylexicaux au milieu des units monolexicales. En effet, les dictionnaires de synonymes qui ont servi de base au dictionnaire fusionn ne font pas de diffrence entre verbes simples, composs ou locutionnels, ce qui est conforme notre vision du lexique et notre souci de ne laisser aucun mot hors de notre tude.

5.2.2 Slection des synonymes et quasi-synonymes de abandonner en anglais


5.2.2.1 Mthode dextraction Comme pour la slection des synonymes en langue source, le recensement des synonymes et quasi-synonymes en langue cible ne saurait tre rcuprable par la seule intuition, ni dailleurs par lobservation, mme approfondie, des dictionnaires bilingues. Les Lexiques Inverss que nous dfendons proposent, en mode fusion des donnes, une mthodologie dextraction des synonymes et quasi-synonymes non directement perceptibles par la lecture des dictionnaires. Toutefois, il ne sagit que dune confrontation au sein dun seul et mme dictionnaire, non dune liste exhaustive de tous les verbes corrls en langue cible. Il est amusant de constater que bien que la dissymtrie soit un phnomne commun tous les dictionnaires, elle ne se manifeste pas de la mme faon selon les diteurs.

122

Dans loptique de proposer un champ lexical restreint au-del duquel un terme de quelque langue que ce soit nest plus considr par nous comme connexe de abandonner, nous nous sommes appuy sur les travaux de Sabine Ploux qui rcuprent les quivalents en anglais du terme dorigine partir du mme procd que celui qui rgit la fusion des dictionnaires des synonymes en franais, sans plus de prcision mthodologique nanmoins :
abandon, abdicate, abjure, abnegate, abolish, abort, abrogate, accept, admit, alienate, annul, apostatize, avert, award, be lost, break, break off, bring to an end, capitulate, cast aside, cast off, cease, change, chicken out, chuck away, chuck out, clear off, come off, come to a , alt/standstill, come to an end, concede, confide, denude, depose, deposit, deprive, desert, desist from, despoil, die, die down, die out, disappear, discontinue, dissuade, ditch, divert, divest, do away with, donate, drop, end, entrust, evaporate, fade, fail, fall, flush out, forsake, funk it, get rid of, give, give away, give in, give the push/boot, give to, give up, give way, go missing, grant, hand in ones office, jettison, kick out, knock off, lay aside, lay bare, leave, leave off, leave to, let have, let take, lift, make concessions, make over, move, move out, neglect, not finish, ooze away, opt out, outgrow, pass, plunder, put a stop to, put an end to, put off, quit, recant, recede, relinquish, remove, renounce, resign, retire from, scarper, set down, shed, shift, slip away, sneak away/out, stop, strip, subside, surrender, swallow up, take flight, take to, throw out, transfer, turn, turn away, turn out, vanish, waive, ward off, withdraw from, yield, yield up

Les synonymes et quasi-synonymes de abandonner en langue source et en langue cible ont leur propre paradigme de synonymes et quasi-synonymes, comme nous lavons prcdemment indiqu. On y retrouve les verbes proposs par Sabine Ploux ainsi que certains autres ajouts grce au relev des traductions des synonymes dabandonner. Tous ne sont dailleurs pas pourvus de traductmes du champ dabandonner car la source de nos donnes bilingues diffrent de celles qui ont servi construire la liste des verbes anglais lISC. Une partie de la base de donnes prparatoire la construction du graphe dabandonner est thoriquement prsente en annexe.

5.3 Les traductions dabandonner 5.3.1 Le LI anglais comme complment riche au LD


Avec les collocations comme facteurs discriminants principaux (une caractristique avantageuse des dictionnaires Robert & Collins), nous obtenons une rpartition des traductmes beaucoup plus fine aprs prise en compte du LI. Le tableau de la page suivante met en avant le phnomne de dissymtrie de la mme faon que ce que nous avons montr pour aborder. Sa structure en est tout de mme trs diffrente puisque nous ne nous appuyons non plus sur les acceptions du verbe mais
123

sur les collocations proposes par le dictionnaire, au nom de lacceptation du phnomne de faible polysmie accept pour abandonner. Les objets de la colonne paraphrase correspondent le plus fidlement possible aux collocations suggres pour chaque acception de lentre du verbe abandonner. La question de la procdure peut tre pose au sujet de la constitution de ce tableau. Nous sommes oblig de reconnatre que cest seulement notre propre intelligence synthtique qui est lorigine de cette vision restructurative des traductions du verbe abandonner. Nous avons cependant fait attention ne pas dnaturer ni surinterprter le matriau lexicographique ce qui ne nous a pas empch de runir de force des collocations diffrentes mais apparentes. Concernant laspect algorithmisable de la conception de ce tableau, nous pouvons effectivement dire quil est absent en loccurrence. Toutefois, lalgorithme que nous avons crit lissue de ce travail mne un rsultat restructuratif trs semblable ce qui est prsent ci-dessous. Dune certaine faon, nous pouvons dire que cette restructuration nave, ralise bien avant notre algorithme, montre grosso modo la mme chose que notre programme de construction de graphes, mais de manire lisible pour un tre humain peu form la programmation informatique.

124

Figure 5 : Tableau des correspondants anglais du verbe ABANDONNER : premire reprsentation du lexique invers franais-anglais

TRADUCTION DROITE desert, abandon leave, abandon fail, desert, forsake

PARAPHRASE dserter un lieu (qqn) abandonner (qqn)

(qualit, partie de qqn) abandonner (qqn) desert, abandon, forsake abandonner intentionnellement abandon, give up abandonner (technique, appareil) abandon, desert abandonner (positions, poste) take flight, give up abandonner le terrain give up, relinquish se retirer de ses fonctions give up, abandon abandonner (tudes, recherches, travail) give up, relinquish, renounce abandonner (droits, privilges, avantages) give up, withdraw from, abandonner (course, lutte, retire from partie) give up, abandon abandonner (projet, espoir, hypothse) retire from, abandon, leave abandonner (le pouvoir) abandonner give up abandonner (mission, opration) abandonner (poursuite, soupons, scrupules) abandonner (forteresse, territoire) abandonner (opinion, mode de vie) abandonner (biens, proprit) abandonner (condition, limite dge) abandonner (vtements) abandonner (ltalon-or) abandonner (le navire) abandonner / laisser abandonner sa main abandonner le soin de abandonner son sort abandonner son corps

TRADUCTION INVERSEE desert abandon, give up, desert, forsake break, ooze away, desert abandon, quit, give up cast aside, give up desert, relinquish quit, give up cast aside, waive, give up, renounce quit, give up, retire hurt (sur blessure) outgrow [en prenant de lge], give up, jettison, relinquish relinquish quit, opt out, give in, give up, withdraw from the game abort [pour raisons de scurit] lay aside yield outgrow relinquish waive leave off come off take to

give to, leave to let (so) take ones hand leave it up toto leave / abandon to ones fate give / abandon ones up to

leave to ones fate yield up


125

leave to (be)

abandonner (un dsastre)

Le tableau ci-dessus fait dabord apparatre un phnomne inhrent la faible polysmie du verbe abandonner : comme nous lavons dj mentionn, les diffrentes traductions se rpartissent en fonction des objets sous-catgoriss par le verbe et pas ncessairement par le dgroupement de ses acceptions, que nous avons finalement ignores. Si lon adopte une vision restructurative partir de ces donnes, il est possible de restituer une structure de lentre abandonner du point de vue de ses traductions. Autrement dit, le dgroupement des acceptions devient identique au dgroupement de ses sous-paradigmes de traductions rpartis par collocations.

5.3.2 Mme les langues romanes


Alors quon pouvait sattendre une distributionnalit bien moindre avec les langues romanes, en loccurrence lespagnol et litalien, il se trouve que les traductions de abandonner dans ces deux langues sont galement prsentes en nombre consquent. Contrairement au R & B, les dictionnaires Bordas et Larousse que nous avons utiliss donnent peu dinformations sur les collocations associes, ce qui ne permet pas a priori de classer les donnes dans un tableau comme nous avons pu le faire pour les traductions anglaises.
ABANDONNER (ESP) = abandonar-abdicar (syn)-aborrecer-aburrirahorcar-arrimar-arrinconar-ceder-ciar-ciar en-dejar-dejar de la mano de Dios-dejar desamparado-derrelinquir-desamparar-desasistir-desertar dedeshabitar-deshacerse de-desmantelar-desocupar-renunciar a-separarse de ABANDONNER (ITA)118 = abbandonare-buttare a mare-desistere dadimettere-lasciare-recedere da-non reggere

Nanmoins, ces traductions fort nombreuses pour un verbe faible polysmie ne sont que moyennement surprenantes eu gard la grande diversit des synonymes et quasi-synonymes du verbe abandonner pour le franais seul. Intuitivement, nous pouvons penser que les paradigmes des synonymes et quasi-synonymes des verbes espagnols et italiens susceptibles de traduire abandonner sont aussi riches dans leurs langues respectives. Cest notamment partir de lobservation de ces paradigmes pour des mots pourtant peu dgroups en acceptions que nous est venue lide de construire des bases de donnes implantables qui rendent compte de leur grande richesse.

118

Le LI franais-italien ntant pas achev ce jour, cette liste est propose sous rserve denrichissement ultrieur. En revanche, la liste des verbes espagnols est en principe complte.
126

6. Lintgration des locutions et priphrases verbales dans le champ de ltude 6.1 Intgration des priphrases verbales dans les lexicaux : exemple partir de se mettre en franais. 6.1.1 Arguments en faveur dune intgration
Dans les reprsentations lexicographiques habituelles, les priphrases ne font jamais lobjet dun traitement compltement spar. Dans un mme ordre dides, dans le dictionnaire dAlain REY et Sophie CHANTREAU (1988) dvolu aux locutions du franais, les entres sont exclusivement des mots simples ou drivs119, chaque expression et locution tant place derrire lentre monolexicale la plus reprsentative . Au-del de la question du degr de figement ou dopacit smantique des locutions, nous considrons quune expression polylexicale a tout autant sa place dans un rseau lexical que les mots simples, pour les raisons suivantes : Les dfinitions lexicographiques sont trs souvent de nature priphrastique, ce qui peut apparatre comme un argument faible dans la mesure o il y a fort peu de synonymie parfaite entre units monolexicales dune langue donne. Toutefois, les priphrases utilises comme dfinitions peuvent elles-mmes tre considres comme des synonymes polylexicaux des mots dfinis, et ds lors acqurir un statut lexical tabli. Une priphrase verbale possde un sens plein qui renvoie une univocit smantique du mme type que celle des verbes mot unique , avec parfois une dimension aspectuelle supplmentaire. Ainsi, se mettre peut tre considr et dfini comme un mot part entire, apparent commencer avec une nuance qui peut tre enfin, contre-cur, avec entrain, etc., selon le contexte dnonciation. Dans un exercice de traduction, lhomognit smantique des priphrases verbales et la non biunivocit interlangue sont bien mises en valeur par le passage dune langue une autre. En dautres termes, une priphrase en langue source est trs souvent traduite par une ou
119

champs

La terminologie employe est celle de Gaston Gross dans son ouvrage de 1996, les expressions figes en franais. Nous distinguons ainsi les mots monolexicaux, dits simples sils sont constitus dun seul morphme ou drivs dans les autres cas, des mots polylexicaux ou complexes qui sont des units composes de deux ou plusieurs mots simples et/ou drivs .
127

plusieurs unit(s) monolexicale(s) en langue cible. Ce phnomne nest ni systmatique ni exceptionnel, les Lexiques Inverss tant remplis de locutions et de priphrases impossibles ignorer et terriblement difficiles classifier. La frquence dapparition des priphrases verbales dans le discours est particulirement leve et ne saurait tre nglige. Cependant, ce dernier point nexclut pas compltement davoir une vision compositionnelle des priphrases. Le dernier argument que nous avancerons est que les priphrases verbales sont tout autant sujettes la polysmie que les verbes monolexicaux, ce que les dictionnaires monolingues mettent peu en exergue. En outre, le nombre de traductions proposes pour certaines dentre elles peut tre trs lev, comme en atteste le relev que nous avons fait pour se mettre . Bien entendu, ces arguments en faveur de leur intgration ne peuvent faire ignorer que ces priphrases ne sont pas autonomes, i.e. elles ne peuvent pas constituer un procs elles seules. Le cas de se mettre est dailleurs trs clair, il sagit dune priphrase aspectuelle qui fait porter un aspect ingressif ou inceptif120 sur le verbe vhiculant le procs. Dans tous ses emplois priphrastiques, se mettre nest donc jamais un verbe autonome mais simplement un auxiliaire aspectuel du verbe. Malgr cela, si lingressif se manifestait en franais et dans les autres langues par un seul auxiliaire ou un seul morphme121, nous naurions pas nous poser la question de savoir comment sorganisent leurs traductions puisque nous naurions pas besoin de faire le choix du meilleur candidat. Or, le paradigme de traductions des priphrases est souvent bien fourni, comme nous allons le voir pour se mettre . Pour autant, nous ne passerons pas sous silence les emplois aspectuels de se mettre devant un nom, par exemple se mettre au basket/dessin/macram, etc. Selon nous, ces expressions sont le rsultat de lellipse dun verbe support (le plus souvent faire) devenu superflu pour la bonne comprhension de lnonc. Dautre part, nous ne
Il existe des nuances subtiles entre les deux aspects selon lendroit o on se place sur laxe aspectuel. Cosriu (1979) place se mettre en position dingressif, cest-dire qui prcde laction (quand on se met travailler, on ne travaille pas encore) alors que Laca (2004) le voit plutt semble-t-il en inceptif, i.e. au dbut de laction (quand on se met travailler, on travaille dj). Les deux visions semblent parfaitement dfendables selon le contexte. 121 Cosriu (1979) et Laca (2004) ne proposent que la priphrase espagnole ponerse a comme traduction de se mettre . Mais il est vrai que leurs articles respectifs traitent de la caractrisation de laspect dans les langues romanes et non pas du potentiel de traduction de chaque langue.
128
120

parlerons pas dans ce chapitre des inclusions de se mettre dans certaines locutions figes comme se mettre table, cette dernire tant dailleurs potentiellement ambigu. Nous traitons ces dernires locutions comme des lexies part entire qui apparaissent littralement comme entres dans nos bases, et non pas comme sousentres de se mettre pas plus que nous ne traiterons cette dernire comme sous-entre de mettre.

6.2 Travail prliminaire sur se mettre


Se mettre est une priphrase verbale remarquable parmi les plus productives en termes de polysmie. Cette caractristique se retrouve dans le paradigme de traductions tabli partir de nos algorithmes personnels. Dans les ensembles ci-dessous, nous navons pas pris en compte les traductions indirectes qui sont difficiles rpertorier et pour lesquelles lalgorithme que nous utilisons est beaucoup plus complexe que pour les deux autres paradigmes de traductmes. Les traductions indirectes ne sont pas explicitement accessibles dans les dictionnaires, i.e. ce ne sont ni des traductions accessibles ni des traductions caches (voir page suivante). Une traduction indirecte est la rsultante dun chemin dune profondeur dau moins 2 dans notre graphe lexical lexception des chemins qui reviennent au point de dpart. Leur recensement passe obligatoirement par une validation de lutilisateur. Dautre part, nous navons que peu pris en compte les diffrences smantiques subtiles qui existent entre les extensions verbales et nominales de la priphrase (par exemple se mettre au travail vs se mettre travailler, les implications aspectuelles ntant pas forcment les mmes dans les deux cas).

6.2.1 Traductions accessibles


Les traductions accessibles sont les traductions proposes lentre lexicale se mettre , laquelle est classe dans le dictionnaire sous lentre mettre. Anglais : start +ing ; start to ; set to ; set about ; get down ; get on with ; begin to ; take to ; take up Espagnol : romper a ; entrar en ; echarse a ; ponerse en ; ponerse ; ponerse a

6.2.2 Traductions caches


Les traductions caches sont dabord les entres lexicales pour lesquelles se mettre est propos comme traduction dans la partie bis des dictionnaires bilingues. Elles servent alimenter les LI. Nous plaons galement sous lappellation
129

traductions caches les termes qui sont suggrs comme quivalents des deux termes traduits sans quil soit ncessaire que le premier traduise ou soit traduit par lun des deux autres. De faon plus synthtique, cela correspond nos liens de synonymie SPS et SPTC dfinis au chapitre IV. Anglais : address os to ; begin to ; begin ; break forth into ; break into ; burst into ; burst out ; get ; get at ; get down to ; come on ; tackle ; take to ; take up ; get going on/with ; fall ; fall about ; go about ; go at ; start ; start to ; set to ; set about Espagnol : apretar a ; arrancarse a ; dar por ; darse a ; largarse ; echar a ; echarse a ; apartar a ; ponerse en

6.2.3 Bilan du recensement


6.2.3.1 Premire vue Les traductions que nous prsentons ci-dessus ne concernent que les emplois pleins de la priphrase, i.e. hors de toute locution plus tendue et plus fige de se mettre et ses extensions (par exemple se mettre table, se mettre sur son trente et un). Par surcrot, elles font toutes rfrence lemploi aspectuel de se mettre dont la paraphrase approximative est tre dans un tat proche de commencer quelque chose ou tre dans la situation davoir dj commenc ladite chose, toujours ingressif ou inceptif. Malgr ces restrictions, le bilan quantitatif de notre recensement effectu sur un seul dictionnaire bilingue chaque fois est le suivant : pour langlais, vingt-cinq traductions au total, neuf accessibles, vingttrois caches et sept communes ; pour lespagnol, treize traductions, six accessibles, neuf caches et deux communes. Le constat le plus flagrant, en dehors de la grande varit des traductions, est que les traductions communes sont largement minoritaires dans le recensement final, ce qui est le cas pour la totalit des verbes hautement productifs de notre base, comme lont dj illustr les tudes faites au sujet des verbes aborder, abandonner et traverser. En raison de la stabilit du sens de la priphrase en dehors de certaines locutions plus figes, nous navons pas voulu confronter les paradigmes de traductions dans un tableau entres multiples comme nous lavons fait pour les verbes prcdents. Il faut noter que pour ces derniers nous navons jamais employ deux fois
130

le mme mode de reprsentation, beaucoup moins par coquetterie qu cause de la faon dont leurs sens sont dgroups en fonction de leurs quivalents dans les langues cibles. Partant de ce constat, il nous a paru vident quune reprsentation des donnes verbe par verbe tait tout bonnement impossible et de toute faon sans intrt, hors lanalyse linguistique qui va avec. Cest pourquoi nous allons en arriver incessamment une rflexion globale sur une mthodologie qui nous permettra dintgrer tous les verbes dans un espace commun avec des critres discriminants partags par tous. 6.2.3.2 se mettre et ses autres emplois Nous rappelons galement lexistence de nombreuses autres occurrences de la priphrase se mettre dans des locutions verbales plus ou moins figes. Bien que nous ne les fassions pas entrer dans notre recensement prliminaire, elles nen sont pas ignores pour autant ; la difficult demeure de dterminer partir de quel degr de figement une locution peut constituer une lexie part entire122 dans nos champs lexicaux. Parmi les expressions figes bties partir de se mettre, nous relevons se mettre table, se mettre sur son trente et un, se mettre en quatre, se mettre dos, se mettre en boule, etc. Faute de pouvoir dcouper sur le mode compositionnel bon nombre des traductions de ces locutions en langues cibles, la solution de les considrer comme lexies est invitable bien quelle ne soit pas satisfaisante dans tous les cas. Par exemple se mettre en colre nest pas prcisment fige et peut avoir une lecture compositionnelle mais se traduira alternativement par une construction avec priphrase (par exemple en espagnol montar en colera) ou un verbe monolexical (enojarse, encolerizarse). En raison du caractre non dcoupable de ce dernier, il est certainement plus sage de les considrer comme lexies ou bien, comme nous lenvisageons rellement, den faire une double criture en acceptant le flottement du degr de figement (deux entres, une avec se mettre en + objet, une avec se mettre en colre littralement). 6.2.3.3 Pr-exploitation des rsultats A partir de nos 38 traductmes anglais et espagnols, il a t possible dtablir un tableau rcapitulatif sur le modle de celui que nous prsentons dans ce chapitre pour le verbe abandonner. Toutefois, ce mode de reprsentation partielle ne rend pas clairement compte du positionnement de se mettre en franais, i.e. quelles sont ses relations synonymiques et parasynonymiques avec ses quivalents en langue source ? Dautre part, ltude de ces derniers doit nous permettre, si elle sintgre effectivement au champ envisag, de faire apparatre un certain nombre de traductions indirectes que la reprsentation lexicographique ne fait pas ressortir.
122

Sur les lexies et le figement, voir notre rflexion au chapitre I


131

Aussi, ce stade de notre tude, une rflexion plus profonde sur lutilisabilit des LI est ncessaire. Nous ne pouvons nous contenter durablement dun simple recensement des traductions caches de chaque verbe dans le seul but denrichir quantitativement les bases lexicographiques. Ceci est dautant plus vrai que chaque traduction dun mot est porteuse dinformations quelle ne partage jamais intgralement (ou trs rarement) avec les autres traductions du mme mot. Les critres distinctifs, de type syntaxique, smantique ou pragmatique pour ne citer que les plus pertinents, sont en outre relativement aiss caractriser ; cest pourquoi il serait prjudiciable de ne pas les faire apparatre dans une base de donnes digne de ce nom et apte permettre lenrichissement automatique des dictionnaires dj disponibles. Au nom de ces rflexions mergentes, nous avons labor une mthodologie de reprsentation des donnes qui mne des paradigmes lexicaux plus lisibles et plus exploitables que les LI primitifs. Le rsultat obtenu est ce que nous appelons les Champs Smantiques Multilingues Unifis (CSMU), des champs protiformes qui sadaptent tous les critres et toutes les langues ncessaires. Afin de complter nos donnes initiales et de prparer nos nouvelles bases de donnes, nous utilisons la technique du balayage explicite ci-aprs. Cette mthode est utilisable pour toute construction dun sous-champ dun rseau global. Celui-ci est implantable par lintermdiaire de lalgorithme prsent au chapitre IV ; la technique du balayage est indpendante de ce dernier et ne prtend pas en remplacer lusage. Elle se contente de lannoncer.

6.3 Intgration par technique de balayage


Lintgration des donnes que nous appelons technique de balayage seffectue de la faon suivante : Premire tape : Chacune des traductions franaises des traductions accessibles et caches de se mettre est recense. Un lien de synonymie plus ou moins direct123 est tabli entre les premires et la priphrase de rfrence, sur la base de notre algorithme principal. Deuxime tape : Chacune des traductions en langue(s) cible(s) des traductions franaises des traductions accessibles et caches de se mettre sont recenses et intgres de la mme faon que prcdemment. Ainsi de suite. Il est vident quun tel travail risque fort de se rvler fastidieux sil nest pas correctement born. Pour limiter la taille du
123

Les traductions directes se voient affecter un lien de synonymie directe avec la lexie dorigine. Les caches en auront un partiel.
132

champ, il peut se rvler ncessaire de prdfinir un paradigme de synonymes du mot-noyau124. Ce faisant, nous excluons du balayage tout terme en langue source qui ne ferait pas partie de ce paradigme initial ; et nous ne rebalayons bien videmment pas partir dune unit lexicale qui a dj t vise. La premire traduction anglaise de notre priphrase-noyau est to begin, laquelle sera par consquent notre second verbe de rfrence125 pour continuer la construction du CSMU autour de se mettre . Ensuite, ce sont les traductions propres de to begin, savoir commencer et se mettre , qui sont prises en compte. La seconde ayant dj t balaye (puisque cest la lexie-noyau dorigine), nous nen refaisons pas lanalyse : 1126se mettre + GVinf to begin 2begin to + GV commencer , se mettre 127 (noyau) ; 3commencer + Gvinf begin to, start to, begin + ing, start +ing, set in (impersonnel en franais, substantivation du sujet en anglais), get (adjectivation de l objet en anglais), [locutions : commencer en avoir assez, bien faire] ; 4start to commencer + GVinf, se mettre + GVinf, ne pas tarder (avec soon en anglais) ; 4begin + ing commencer (, de), se mettre (), entreprendre, entonner, dclencher, entamer, dboucher, prendre un nouveau, partir en, dbuter dans. ; 4start + ing etc. Les informations syntaxiques, pragmatiques et lexicales que le dictionnaire propose sont prsentes dans cet extrait et sont galement intgres dans nos champs lexicaux finaux, par lintermdiaire de la base de donnes.

6.4 Bilan de lintgration des priphrases ltude, et des lexies aux champs lexicaux de faon gnrale
Lavantage le plus saillant de ces champs smantiques unifis est lvidence de permettre un rapprochement lexico-conceptuel de langues diffrentes. La mthode soulve nanmoins de nombreuses questions pratiques et mthodologiques : en
124 125

Comme nous le proposons pour abandonner. Le premier verbe de rfrence tant bien entendu se mettre . 126 le chiffre 1 indique que nous sommes la premire tape du balayage. Le verbe suivant, muni de lindice 2, est par consquent la deuxime tape, et ainsi de suite. 127 Dj balay et par consquent ignor pour la suite du processus.
133

premier lieu, quel crdit peut-on confrer des uvres lexicographiques humaines ? Si nous les jugeons infaillibles, les champs qui en dcoulent doivent ltre tout autant. Or, les erreurs et plus encore les lacunes quils contiennent se rpercutent fcheusement au sein des graphes gnrs mme si elles se rencontrent en nombre limit. Dans une perspective dautomatisation, la mise en relation des lexies par balayage et relations synonymiques nous permet de diluer certaines associations douteuses et ainsi de pallier les insuffisances prsumes des dictionnaires de langues. Toutefois, il nest ni dans nos intentions ni dans nos prrogatives de critiquer ces derniers ; seul ltablissement dune mthodologie originale pour la construction de nouveaux lexiques nous conduit les analyser dans les moindres dtails. En ce qui concerne les priphrases verbales, et par extension toutes les locutions sens identifiable, leur prsence au sein des champs se rvle aussi utile quindispensable. La forme de nos lexiques leur confre une entre autonome par rapport leurs constituants monolexicaux, ce qui permet par exemple de clairement identifier se mettre comme lexme, en le distinguant du verbe mettre. Nous ne sommes pas loin den proposer un traitement autonome dans les dictionnaires, de faon aller plus loin que Rey et Chantreau qui persistent les rpertorier sous le terme monolexical le plus reprsentatif dans leur dictionnaire des locutions.

7. Prolongement des LI 7.1 La traduction intermdiaire : Paraphrase ou pas paraphrase ?


Au dbut de nos recherches, nous pensions que toute lexie devait tre paraphrase - ou formalise128 - afin dtre confronte sous une forme non littrale aux candidats. De ce fait, la traduction intermdiaire devait tre le premier travail indispensable sur le mot-source hors (ou paralllement ) la reconnaissance des registres de langue. Nous partirons de ce principe dans les paragraphes qui suivent, avant de proposer une conclusion critique de cette mthode de transfert. Pour susciter une traduction, un terme peut devoir tre rcrit . Il faut donc accomplir un travail initial de paraphrase. Celui-ci nest pas exclusivement dtermin par les entres des dictionnaires monolingues mais en ncessite nanmoins lemploi129. Dautre part, la paraphrase que nous prconisions ne doit pas tre trop fine ds le dpart de ltude, par exemple il nous parat inutile de considrer toucher au rivage
128

Avec un formalisme qui en prcise la signification. Voir ce sujet la primitive propose pour le verbe abandonner au milieu de ce chapitre. 129 Pour aborder (franais italien), les sens rsiduels attaquer (un ennemi) ou commencer traiter (une matire (intellectuelle)) sont induits par les traductions proposes dans les dictionnaires bilingues mais sont ignors - ou non explicits- par les monolingues que nous avons consults (Larousse, Robert). Ces acceptions nouvelles sont bien prsentes dans le TLF, lequel pourrait tre outil lexicographique de rfrence sil ntait aussi riche.
134

et toucher le rivage comme deux paraphrases-sources distinctes aussi bien parce que le sens profond est le mme pour les deux constructions que parce que le mot-cible quivalent leur est galement commun. Toutefois, comme il sagit de deux constructions syntaxiques distinctes, il faudra ncessairement les implanter toutes deux explicitement lors de lautomatisation du lexique, ce qui motive une distinction claire entre paraphrases et critres discriminants dans la perspective de constituer la base de donnes. En dfinitive, la paraphrase dfinitoire nest pas indispensable dans loptique de raliser des graphes lexico-smantiques car le format de la base de donnes permet dintgrer un nombre de critres non pralablement dlimit. Dautre part, nous pouvons crer autant de liens que ncessaire dans lalgorithme qui laccompagne. Au cur de notre rflexion mthodologique, nous suggrons lemploi des liens synonymiques entre les lexies de toutes les langues implanter dans nos graphes. De ce fait, le meilleur synonyme ou la meilleure paraphrase dun mot nest peut-tre rien dautre que ses traductions (donc dans dautres langues que lui-mme) voire ventuellement les traductions de ses traductions contexte quivalent (lien indirect de synonymie qui ramne une confrontation entre mots dune mme langue).

7.2 Reprsentation des lexiques multilingues issus du LI. Projet de superposition de champs smantiques en plusieurs langues. 7.2.1 Transition avant graphe
7.2.1.1 Aller au-del des LI bidimensionnels Certes, les Lexiques Inverss ont permis de donner une nouvelle vision des dictionnaires de langues. Toutefois, la reprsentation bi-dimensionnelle des correspondances interlexicales noffrant pas de rsultats satisfaisants au-del du bilingue, nous avons rflchi une autre mthode de co-reprsentation des donnes qui permettrait en particulier dimplanter toutes les langues impliques dans un mme graphe.

135

7.2.1.2 Exploration dun formalisme conceptuel La premire piste envisage tait dlaborer des cases lexico-conceptuelles (Clc) dans un rseau smantique prexistant, de type DI130 ou Wordnet. Chacune de ces cases, rappelons-le, correspond un sens dtermin du terme dorigine et contient toutes ses traductions les plus pertinentes dans les langues cibles. Cette mthode pose deux problmes essentiels : Elle contraint une reprsentation initiale des connaissances fonde sur une langue donne (le franais en loccurrence). Elle ne met pas en exergue linadquation entre les systmes lexicoconceptuels des diffrentes langues. On suppose en effet que la constitution des Clc a pour effet de figer le rapport interlangue dans une forme de pluriunivocit qui nexiste pas dans les faits. Ces deux points ont donc conduit la recherche dune modlisation plus souple et peut-tre plus floue du lexique multilingue. En partant du principe que chaque langue constitue un continuum instable et htrogne et quil ny a pas (rptons-le) adquation avec les autres langues, il sagissait de rendre ces disparits tout en respectant les spcificits de chacune. En premier lieu, il nous a paru encore plus indispensable que judicieux de raisonner en terme de champs smantiques et non plus de lexmes, au nom du principe prvalant quil vaut mieux viter dutiliser prfrentiellement une des langues impliques comme point de dpart de la reprsentation des connaissances. Ces champs smantiques sont intgrs au rseau smantique par lintermdiaire de primitives dont nous donnons un aperu un peu plus loin. Pour tre clair, voici comment sorganiseraient ces champs : A partir des classes ontologiques, constitution de primitives conceptuelles (dans notre cas, ce seraient des prdicats primitifs formaliss) ; construction des champs smantiques unilingues et superposition de ces derniers au sein du mme graphe avec des marqueurs de langue (F pour franais, E pour english, etc.). Ou encore construction dun champ smantique dans une langue donne et ajout successif ou simultan des champs smantiques associs dans les autres langues ; pour chaque mot intgr au champ, constitution dune structure de traits que nous dcrivons par ailleurs. Cette structure napparatra pas
130

Dictionnaire Intgral de Dominique Dutoit, largement dcrit au Chapitre I


136

sur le graphe mais pourra tre directement active depuis celui-ci (par hyper-lien). Dans un but de TAL, ces structures seront particulirement importantes. En principe, on ne devrait pas trouver plusieurs units lexicales occupant la mme case au sein du champ mais il peut y avoir des cas de paralllisme parfait faisant figure dexception comme cela se rencontre assez souvent entre le franais et litalien. Lobjectif est une reprsentation commune qui fait lconomie du pivot, ne met pas de langue en avant par rapport aux autres et met en exergue les dcalages lexicoconceptuels interlangue. Il reste maintenant savoir comment construire ces fameux champs smantiques. Pour cela, nous aurons besoin de constituer une mthodologie, un algorithme et de faire apparatre la dmarche de limplantation de donnes vers leur exploitation en TAL. Toute cette problmatique est lobjet du chapitre IV.

7.2.2 Tableaux de donnes


Toutes les donnes prsentes ci-dessous dans les fragments de notre base sont directement issues des dictionnaires, sans ajouts daucune sorte et moyennant certains amnagements pour les faire correspondre nos catgories classifiantes. La forme de ces bases illustre la question des synonymes que nous venons de soulever. Il est noter que obj1 est lobjet ou le complment dun verbe transitif et obj2 est le second complment dun verbe bitransitif, le second complment non obligatoire dun verbe transitif ou le complment non obligatoire dun verbe intransitif. 7.2.2.1 Essai sur aborder
Figure 6 : Fragment du tableau de donnes autour de aborder
motsource aborder aborder aborder aborder aborder aborder aborder aborder aborder LS motcible abordar atracar abordar atacar acometer asaltar atacar acometer asaltar attaquer acometer attaquer asaltar attaquer atacar attaquer asaltar attaquer atacar attaquer acometer LC synLS SynLC atracar abordar navire fig fig fig fig fig fig obj1 Obj2 (port, pays) suj constrLS a/en obj2 a/en obj2 constrLC a/en obj2 a/en obj2 registre infoscomp ls

137

motsource aborder aborder aborder aborder aborder aborder aborder aborder aborder saborder aborder aborder aborder aborder aborder aborder

LS

motcible abordar abordar tratar tocar abordar tratar tocar enfocar emprender abordarse (acceder)132 (acostar) (tener acceso) (unirse) (acercarse) (tocar)

LC

synLS

SynLC

obj1 personne

Obj2

suj

constrLS

constrLC

registre fig fig fig fig fig fig fig

infoscomp ls

tratar tocar abordar tocar abordar tratar envisager

(sujet)131 (sujet) (sujet) (sujet) (sujet) (sujet) ouvrage, lecture

(accder) (accoster) (avoir accs) (joindre) (sapproc her) (toucher)

7.2.2.2 Essai sur abandonner


Figure 7 : Fragment du tableau de donnes autour de abandonner
motsource abandonner abandonner abandonner abandonner abandonner abandonner LS f f f f f f motcible abandonar dejar descuidar descuidar abandonar soltar LC synLS e e e e e e lcher dlaisser laisser ngliger abandonar descuidar (ouvrage) (devoirs) (amis) (amis) (rnes) SynLC obj1 obj2 suj constrLS constrLC registre infoscomp ls

131

La collocation objet un sujet est prsente dans le syntagme exemple aborder un sujet qui accompagne les trois traductions abordar, tratar et tocar. Toutefois, elle nest pas prsente de telle faon quon comprenne quil sagit dune restriction sur lensemble des objets possibles pour lacception considre. Dans ces conditions, nous le faisons apparatre entre parenthses. 132 Les dictionnaires bilingues Larousse ont la particularit de proposer parfois des synonymes traduits de la mme langue que la vedette en entre. Ici accder est prsent comme synonyme daborder et se traduit par acceder lorsque son acception se rapproche de celle(s) daborder. Ceci ne signifie pas que acceder est une traduction potentielle daborder sans lexclure totalement. Cela ne veut pas non plus dire, et cest trs important, que acceder est ncessairement candidat la traduction lentre daccder. Nous avons choisi de ne pas ignorer ces couples synonyme-traduction dans nos bases de donnes, bien que nous ne puissions pas leur rserver le mme sort que les traductions directement accessibles. Dans limmdiat, nous les mettons entre parenthses lintrieur de la base de donnes afin de les distinguer des autres types de donnes.
138

motsource abandonner abandonner abandonner abandonner abandonner abandonner abandonner abandonner abandonner abandonner abandonner

LS f f f f f f f f f f f

motcible confiar dejar conceder desistir de renunciar a renunciar a cesar entregar entregar desahuciar abandonar abandonarse desanimarse acorbardarse descuidarse dejarse entregarse

LC synLS e e e e e e e e e e e e e e e e e se livrer perdre courage prendre peur livrer remettre confier confier accorder

SynLC dejar confiar

obj1

obj2

suj

constrLS

constrLC

registre

infoscomp ls

(detail) renunciar a desistir de cesar renunciar a (lutte) (lutte) (biens) (biens) (malade) [intrans] (crancier) (crancier) a obj2 a obj2 a obj2 a obj2 (prtentions)

sabandonner f sabandonner f sabandonner f sabandonner f sabandonner f sabandonner f

dejarse descuidarse (sommeil) a obj2 a obj2

dans tenue dans tenue

sa sa

Nous avons saisi des donnes presque compltes pour le verbe abandonner et ses synonymes et quasi-synonymes entre le franais et langlais. Les bases qui en dcoulent seront prsentes en totalit ou en partie, selon le volume, dans lannexe qui sera jointe au document rdig principal. 7.2.2.3 Essai sur se mettre ()
Figure 8 : Fragment du tableau de donnes autour de se mettre ()
motsource LS motcible LC synLS SynLC obj1 obj2 suj constrLS constrLC Registre Infoscomp ls

se mettre

se mettre f se mettre f se mettre f se mettre f se mettre f se mettre f se mettre f se mettre f se mettre f se mettre f

go turn

e e e e

se placer froid, chaud, orage rgime get down to travail set about ones travail set to travail

objet

go on set to

get down e to set about e ones e set to get down e to set about e ones e start set about e

set about ones travail set to get down to set about start travail travail traduction traduction

139

motsource

LS

motcible

LC synLS

SynLC

obj1

obj2 suj

constrLS

constrLC

Registre

Infoscomp ls

se mettre f se mettre f se mettre f se mettre f se mettre f se mettre f se mettre f se mettre f

take up start begin to start to start begin to start to

e e e e e e e begin to start to start start to start begin to

langue action action action action action action pleuvoir + inf + inf + inf + inf + inf + inf

coming on e to

7.2.3 Conclusion intermdiaire


Ces tableaux de donnes sont opratoires , cest--dire quils vont directement permettre une implantation du graphe lexico-smantique via lalgorithme appropri. Au sens o nous lentendons jusqu prsent (prcis au Chapitre I), chaque ligne des bases correspond une lexie, i.e. un emploi prcis dun terme, et son ou ses quivalent(s) en langue cible et ventuellement en langue source si le verbe propos en traduction est muni dun renvoi vers un autre verbe que celui reprsent par la lexie. Dans limmdiat et au risque de nous rpter, nous navons rien saisi dautre que ce que les dictionnaires mentionnent explicitement dans leurs pages.

8. Transition avant tude sur corpus 8.1 Le statut des traductions dans le miroir
Avant de poursuivre ltude du lexique par des considrations linguistiques et algorithmiques, il ne faut pas ngliger de jeter un regard critique sur la structure et la validit du contenu des LI. Tout dabord, leur cration namliore pas la lisibilit de la traduction dune langue une autre. Au contraire, lafflux de nouveaux traductmes en rangs dsordonns a plutt pour effet dalourdir les paradigmes sans rellement proposer de solution pour clarifier les choix et les critres qui permettent de les faire. Sils demeurent importants dans la perspective dtudes contrastives cibles comme celles que nous avons menes dans ce chapitre, les LI seront remplacs par les CSMU dans une perspective de modlisation. Dun certain point de vue les bases de donnes menant aux CSMU sont la rsultante de la fusion filtre entre le LD et le LI tel que nous en caressions le projet, le tout prsent dans un format qui donne directement accs aux informations linguistiques propres chaque lexie tout en respectant lorientation de la traduction propose par les dictionnaires. Autrement dit, le principe du miroir est quelque peu nuanc par la notion de priorit dans les traductmes, le LI
140

ne saurait se substituer un second traducteur du LD . Dautre part, la question de lorientation du graphe est un faux problme pralable puisquun algorithme digne de ce nom peut aussi bien dsorienter le graphe que le conserver en ltat initial.

8.2 Les limites de lobservation des dictionnaires


Lobservation des dictionnaires est dj en soi une tude sur corpus, et ce doublement : tout dabord, nous admettons quun ouvrage lexicographique est un corpus, cest--dire un ensemble dlments reprsentatifs de la langue et dun paradigme particulier, en loccurrence celui des lexies de plusieurs langues. Dautre part, les dictionnaires utilisent les corpus pour leur constitution. Nanmoins, un certain nombre de contraintes pour la plupart lies au format de ldition empchent les ouvrages lexicographiques doffrir une visibilit entirement satisfaisante des phnomnes linguistiques qui prexistent leur cration. Il est galement vident quun dictionnaire grand public se doit de reflter la langue acadmique, celle qui est prconise par les gardiens du Temple , et accessoirement les faits de langue qui sont prsents dans les dictionnaires monolingues du mme diteur. Il est peu probable quun dictionnaire srieux se permette de rpertorier minutieusement les fantaisies des auteurs littraires en les prsentant comme des faits de langue tablis, notamment destination des locuteurs non natifs. Cest pourquoi nous avons t amen poursuivre nos rflexions par des analyses linguistiques dbarrasses des contraintes lies au cadre lexicographique, en nous fondant exclusivement sur des donnes attestes extraites de la base littraire FRANTEXT. En particulier, nous avons relev deux phnomnes linguistiques que les dictionnaires bilingues ne peuvent pas traiter de par leur nature : Tout dabord, il est trs difficile de slectionner des traductions concurrentes pour une mme acception en fonction de la nature smantique des arguments du verbe, voire en fonction du co-texte un peu plus loign, ce dernier tant moins dpendant du verbe mais participant galement sa caractrisation smantique et aspectuelle. Mme dans le dictionnaire grand public le plus labor (i.e. offrant des informations relativement prcises sur les arguments habituels pour chaque acception), le problme demeure car louvrage ne propose que le choix dun objet ou dune classe dobjets sans entrer plus en dtails dans sa nature smantique. Cest pourquoi nous avons dcid de nous pencher sur le verbe traverser, en collaboration avec Laurent Mascherin qui sintressait ce verbe au mme moment, avec des objectifs lgrement diffrents. Le verbe traverser est fortement dpendant de son environnement co-textuel quant sa caractrisation aspectuelle, ce qui le rend difficile traduire si ce co-texte nest pas prcisment tudi.
141

Ensuite, les dictionnaires bilingues ainsi que les monolingues destins au grand public sont avant tout des ouvrages acadmiques qui se doivent de reprsenter la langue telle quelle est normativement tablie un moment du temps. Ceci exclut de pouvoir y trouver des sens de mots nouveaux ou des constructions syntaxiques nouvelles qui nauraient pas t valides par les lexicographes comme faisant partie intgrante de la langue. Or, lobservation des uvres littraires fait clairement apparatre que les sens et constructions inhabituels ou inattendus sont loin dtre des phnomnes rsiduels. ce sujet, les auteurs littraires font la preuve que la langue nest pas seulement un systme fig mais surtout un socle normatif partir duquel de nombreuses fantaisies dexpression sont possibles. Lmergence de sens nouveaux pour les verbes eux-mmes est parfois difficile dcrire ; nous lavons notamment constat avec certaines occurrences de traverser qui restent pour nous ininterprtables, et par voie de consquence intraduisibles. En revanche, il est plus ais de rpertorier les constructions syntaxiques nouvelles (surtout si elles se rptent dans des uvres littraires diffrentes) de mme que loriginalit dans la nature smantique des arguments du verbe. Les verbes qui font partie du vaste paradigme des verbes de parole sont particulirement mallables de ce point de vue et cest ce qui nous a conduit en proposer ltude partir de FRANTEXT dans le but avou denrichir les bases de donnes dorigine lexicographique sans en modifier la structure. Ces approches seront lobjet des dveleppoments suivants dont la finalit est dobserver la ralit du langage sans contraintes a priori afin de ramener la description de celui-ci aux intentions relles des auteurs ou tout le moins de sen rapprocher le plus possible. lissue de nos analyses, nous esprons montrer comment lobservation de donnes attestes peut complter ou enrichir nos bases de donnes sans en bouleverser la mthodologie dans le but de runir toutes les informations linguistiques dans une mme source dinformations.

142

9. Les verbes de parole 133 en contexte


Le nombre trs lev des verbes de parole en franais ne nous a pas permis deffectuer une synthse complte des donnes lexicographiques les concernant. Toutefois, lintrt dobserver le paradigme dans son ensemble rside davantage dans les disparits et les similarits dans leurs structures argumentales smantiques, et dans les constructions syntaxiques attenantes. Nous pouvons noter en particulier la multiplicit des types de complments que lon peut trouver derrire les verbes de parole. Une typologie de ces complments devra prendre en compte de manire orthogonale leurs caractristiques grammaticales aussi bien que leur contenu smantique. propos de ce dernier, nous remarquerons quun mme objet smantique peut tre objet direct de certains verbes et objet indirect de certains autres.

9.1 Quelques mots sur la linguistique de corpus


Avant de nous lancer dans lanalyse proprement dite, nous allons proposer une petite rflexion au sujet du corpus et de son utilisation en linguistique. Lorsquon parle de contexte dans le cadre de la linguistique, cest gnralement le co-texte qui vient immdiatement lesprit, cest--dire le texte proche de loccurrence que lon veut dcrire ou encore ce qui est dit ou crit avant ou aprs cette occurrence. En ralit, le contexte est une notion beaucoup plus vaste qui englobe de nombreux types quon ne peut pas ignorer pour constituer une typologie mais qui ne sont pas tous perceptibles lorsquon na pas pleinement accs au contexte dune production de langage. Pour essayer dexpliquer la notion, Georges Kleiber propose de lillustrer par un certain nombre doppositions ou de dimensions du contexte 134 :
() La meilleure manire, notre avis, consiste parcourir un certain nombre doppositions, de dimensions du contexte, reconnues ou non, plus ou moins fortement prsentes dans la littrature, telles que () : 1) en contexte/hors contexte 2) contexte dfini comme ensemble dlments qui influencent/contexte comme environnement 3) contexte inventaire/contexte comme cadre ou ensemble structur
133

Pour respecter la nouvelle orientation de recherche des membres du PDR de lILF auquel nous avons particip, nous devons nuancer cette appellation de verbes de parole en prcisant quil sagit avant tout de verbes impliquant ncessairement et explicitement de la production de langage humain dans des emplois bien dtermins. Cela en fait avant tout des verbes de communication langagire davantage que des verbes de parole au sens communment admis. Toutefois, lannonce tardive de cette nouvelle dnomination et des rserves qui laccompagnent nous ont conduit ne pas bouleverser la structure de notre sous-partie qui traite de ces verbes, mais nous a conatrint en restreindre limportance. 134 Kleiber (1997). Quand le contexte va, tout va et inversement , in Co-texte et calcul du sens, Claude Guimier d., Presses Universitaires de Caen.
143

4) contexte : emploi rationnel (direct)/emploi absolu (indirect) 5) contexte gnrique/contexte spcifique 6) contexte linguistique (co-texte)/contexte extra-linguistique (ou situationnel) 7) contexte immdiat (micro-contexte)/loign (macro-contexte) 8) situation dnonciation immdiate/situation plus large 9) contexte gauche/contexte droite 10) contexte statique/contexte dynamique (ou processuel) 11) contexte analyste-observateur/contexte locuteur/interlocuteur 12) contexte du locuteur/contexte de linterlocuteur 13) le contexte dtermine le sens/le sens dtermine le contexte 14) contexte global ou texte ( ?)/contexte dune unit (qui peut varier) 15) le contexte pr-existe (est donn)/le contexte est construit, etc. Kleiber (1997 :13)

Comme le suggre Kleiber dans ce relev, la liste des oppositions et des dimensions peut tre poursuivie longuement. La premire opposition est essentielle car elle ouvre le champ des possibles pour le contexte ds lors quil est admis que le hors contexte nest rien dautre que :
() [l]analyse de llment en lui-mme, sans influence dautres lments, le contexte dans cette perspective est conu comme tant ce avec quoi se combine llment (en laissant un sens trs large la notion de combinaison) () Kleiber, op. cit., p.14

Dans cet ordre dides, lanalyse dite hors contexte devient un exercice de haute voltige sans spectateur dans la mesure o un lment nest jamais compltement isol, ft-il la partie dun exemple construit, lui-mme hors contexte dans un sens moins restreint. Ce paradoxe est galement relev par Kleiber tant entendu que le co-texte dun exemple construit est dj en soi un contexte pour llment vis. partir de ces considrations de dpart et ds quon admet la sparation entre exemples construits et exemples attests, lopposition qui nous parat la plus intressante est la sixime de Kleiber : contexte linguistique (co-texte)/contexte extralinguistique (ou situationnel). En la prcisant, on parvient expliquer en partie un bon nombre des autres oppositions quil propose. En premier lieu, il convient de ne pas confondre co-texte et contexte, le second englobant notionnellement le premier. Le cotexte dune unit est toujours prsent dans lanalyse linguistique, quil sagisse dtudier des exemples construits135 ou des occurrences attestes. En revanche, le

135

On peut se rfrer diverses polmiques amicales (M. Charolles) et certains exercices de style, comme dans Kleiber (1994) Discours et strotypie : le contexte peut-il remettre daplomb une anaphore associative mal forme ? , in C. Schnedecker,
144

contexte extra-linguistique (que nous appellerons situation dnonciation pour viter de le confondre avec contexte au sens large) est ncessairement lapanage dune situation relle de production langagire. Or, ce dernier point de vue ne va pas sans un certain paradoxe : si la situation dnonciation est propre au rel, quen est-il des occurrences attestes issues de corpus dont on ignore avec le recul tout ce qui est du domaine extra-linguistique ? Nous navons pas pu rsoudre ce problme lors de nos analyses linguistiques sur corpus littraires, car lauteur dun roman est parfois le seul pouvoir dcrire prcisment la situation dnonciation associable chaque passage de son ouvrage, si tant est quil et lintention de la caractriser. Par consquent, des travaux comme les ntres ne peuvent pas prendre en compte de manire exhaustive des donnes qui nous chappent. Il ne nous reste gnralement que le co-texte tudier, et nos intuitions, nos connaissances et notre imagination pour placer celui-ci dans un cadre danalyse digne de ce nom. De ce fait, la rponse la question le co-texte est-il un contexte restreint ? est ncessairement positive, notre position danalyste en herbe ne pouvant nous permettre dinventer la place des auteurs un contexte plus large dans lequel interviennent pourtant des facteurs essentiels pour la bonne comprhension globale des noncs. En ce sens, le travail hors contexte, ou plus exactement sur exemples construits (ventuellement enrichis, comme nous le prcisons en note), ne parat plus aussi condamnable que ce qui se dit de plus en plus dans la communaut scientifique. Cest dans la droite ligne de cette rflexion densemble que nous estimons dangereuse la polmique qui consiste stigmatiser les btisseurs de corpus ad hoc. Aprs tout, tous les exemples attests ont t un jour construits par quelquun, certes rarement par un linguiste, et en un sens ont rpondu galement un besoin particulier de lauteur qui les a produits. Mme si le corpus est au centre de la polmique sur la linguistique contextuelle, il nest pas facile dexpliquer clairement de quoi il sagit. En tant que tel, un corpus est un ensemble de donnes homogne, cest--dire qui concentre des textes ou des objets textuels de mme nature. Daprs cette dfinition initiale, on peut considrer quun ensemble dnoncs construit par un linguiste est en soi dj un corpus. Cest pourquoi nous devons en restreindre la dfinition pour pouvoir parler de linguistique de corpus sans nous contenter de lopposer en tant qu objet impur la grammaire universelle leve au rang de systme de la langue dbarrasse de ses souillures que sont la culture, la socit, lhumeur ou les pathologies du locuteur .136
M. Charolles, G. Kleiber et J. David (d.), Lanaphore associative. Aspects linguistiques, psycholinguistiques et automatiques, Paris, Klincksieck. partir dun seul exemple danaphore associative, Georges Kleiber montre quen tendant le contexte dun exemple construit, on rsout certaines incohrences qui prexistaient du fait de lexistence de loccurrence hors contexte suffisamment tendu. 136 Cette opposition est mise en relief par Damon Mayaffre dans sa confrence inaugurale au colloque JETOU 2005, Rle et place des corpus en linguistique : Rle et place des corpus en linguistique : rflexions introductives .
145

En linguistique de corpus proprement dite, le corpus est tout ensemble de donnes qui na pas t conu dans loptique explicite de devenir un observable linguistique. Daprs Damon Mayaffre, la question est de savoir si le vritable corpus devenu un observable malgr lui est un observatoire dune thorie a priori ou un observ dynamique qui permet de dcrire puis dlaborer des modles a posteriori. Cette opposition pistmologique sert Sinclair pour prsenter ses deux linguistiques de corpus que nous allons dcrire ci-aprs. Cette question de fond ne remet pas en question la nature propre du corpus qui demeure un statut dobservable duquel on fait ce quon veut. Derrire ces deux interrogations, contradictoires en apparence, se cache toute la polmique actuellement vivace sur le sujet. En effet, avec lmergence toute nouvelle des moyens informatiques de numrisation et de traitement des donnes textuelles, tudier un phnomne de langue sur corpus nest plus un exercice fastidieux ni une impossibilit. Il reste nanmoins des domaines o la recherche doccurrences demeure un travail de fourmis, comme cest le cas pour les tudes en ancien franais. Toutefois, la grande disparit et, disons-le tout net, la relative pauvret des corpus du franais peuvent remettre en question leffort de systmatisation dune discipline que lon nommerait linguistique de corpus , faute de pouvoir la caractriser plus prcisment. Il ne sagit pas pour nous dentrer dans une polmique centre sur des questions aussi circulaires que : Peut-on se passer des corpus en linguistique ? Comment faisait-on numrisation ? avant ?, sous-entendu avant lre de la

Avec les tudes que nous avons menes au sujet des verbes de parole et de traverse partir de FRANTEXT, nous nous limiterons proposer ou corroborer des pistes de rflexion sur le rle et la place que lon peut accorder un corpus textuel dans une tude linguistique, de mme que nous essaierons den reprer et dcrire les limites.

146

Selon John Sinclair, prcurseur et pionnier de ltude des collocations, auteur et initiateur du COBUILD137, il existerait deux courants majeurs sous lappellation de linguistique de corpus : La linguistique fonde sur le corpus utilise le corpus pour valider ou vrifier des hypothses antrieures la consultation des donnes. Cit par Ooi (1998), Sinclair la dcline comme suit :
Corpus-based linguistics - a corpus is used to validate, check, and improve linguistic observations that have already been made; the corpus-based linguist does not feel threatened by corpus data at all - the linguist does not question received theoretical positions or wellestablished descriptive categories; instead, his position to language structure is already well-formed - the corpus is used to help extend and improve linguistic description An example of a relevant question: Is whom still used in English, and if so how? Sinclair (1996)

Lexpression la plus frappante dans la dfinition propose par Sinclair est que le linguiste ne se sent pas du tout menac par les donnes attestes dans le cadre de la corpus-based linguistics, ce qui semble induire quil existe des situations dans lesquelles le linguiste se sent menac. On peut sentir dans cette description les limites entre une linguistique confortable mais dnue de ressources extrieures et la linguistique dirige par le corpus, laquelle prsuppose que le linguiste na que peu da priori avant dentamer ses recherches, comme nous allons le voir maintenant. galement dfinie par Sinclair et directement compare la prcdente, la linguistique conduite ou dirige par le corpus na pas les mmes orientations que son quivalente fonde sur le corpus. La caractristique principale de la corpus-driven linguistics est quil ny a pas dhypothse sur la langue qui soit antrieure lobservation des donnes. Ce sont ces dernires qui font merger les phnomnes que le linguiste doit dcrire :
Corpus-driven linguistics - a corpus is of prime importance in bringing out new ideas for the examination of data
137

COBUILD : base de donnes des collocations pour langlais initie par John Sinclair.
147

- the linguist believes that the kind of evidence emerging from corpora may be difficult to reconcile with established positions in the discipline, and he leaves open the possibility of the need for a radical change in linguistic theory in order to cope with the evidence - evidence from the corpus is paramount, therefore the linguist makes as few assumptions as possible about the nature of the theoretical and descriptive categories An example of a relevant question: Is the distinction between grammar and lexis necessary? Sinclair (op.cit.)

En marge des deux orientations prcites, nous entrevoyons lmergence potentielle dun troisime courant, celui que nous appellerions la corpus-associated linguistics . Dans un esprit de rconciliation des thories, ce courant potentiel de la linguistique de corpus rsulte de la collaboration entre des hypothses ou des donnes pas forcment attestes et les occurrences issues de corpus, les unes et les autres se compltant sans sannuler. Cest de cette faon que nous voulu btir notre propre mthodologie de faon raliser des modles protiformes capables de sadapter toutes les sources de donnes possibles. Par extension, nous avons galement voulu montrer quil ny a pas forcment dincompatibilit entre les sources monolingues et bilingues ds lors que la modlisation est supporte par un algorithme susceptible de prendre en compte tous les cas de figure.

9.2 Traitement des verbes de parole


Reprenons la dfinition que Jamrozik prsente dans sa thse (1992) :
La totalit du corpus envisag compte 410 verbes qui, malgr lappellation commune de verbes de parole, forment un ensemble smantiquement et syntaxiquement htrogne. Par verbes de parole, ou verbes du dire, nous entendons les verbes qui dnotent une activit linguistique du sujet parlant, exerce en vue de communiquer un message au sens large du terme : transmission dinformation, tentative dinfluer sur le comportement de linterlocuteur, demande dinformation, expression des sentiments, etc. La communication ne se rduit pas ainsi un simple change de connaissances, mais englobe un cadre vari de relations interhumaines. Dans ce sens, notre analyse porte sur un champ plus limit par rapport celui de B. Bojar qui a tudi tous les prdicats donnant une information sur linformation : nous ne nous occupons en effet que des cas o cette information est transmise au moyen de la parole, rduisant la classe des sujets verbaux la catgorie des tres humains.
148

La dfinition ci-prsente ne savre toutefois pas assez restrictive, ce qui a pos le problme dun choix adquat parmi les units du corpus. En effet, elle permet dinclure parmi les verbes de parole aussi bien les verba dicendi proprement dits () que les verbes au smantisme plus large pouvant tre considrs comme verbes de parole dans lune de leurs acceptions () Jamrozik, 1992

Bien que donnant les informations essentielles pour notre nomenclature, Jamrozik offre une dfinition des verbes de parole en tant quactes de langage avant toute chose. Pour notre part, seule la transmission dun message au moyen de la parole forme le sme commun tous les verbes que nous regroupons sous lappellation verbes de parole. Par ailleurs, la restriction du troisime paragraphe entre les verba dicendi proprement dits au dtriment des verbes au smantisme plus large ne nous parat pas fonde dans une perspective de linguistique contextuelle. Les premiers sont galement des verbes polysmiques (a ne me dit rien, voil un exemple parlant, etc.) et ne sont verbes de parole proprement dits quen fonction de leur acception premire138. Cest pourquoi nous ne ferons pas de distinction initiale entre les deux catgories proposes par Jamrozik, et que nous ne traiterons que les acceptions et occurrences de chaque verbe qui dnotent une activit de parole en contexte. Partant de l, la typologie des verbes observs dcoule des occurrences dun point de vue linguistique centr sur le corpus. Une autre nomenclature des verbes de parole nous est propose par Michel CHAROLLES et Batrice LAMIROY dans les travaux prliminaires au Projet De Recherche ILF transitivit initi en 2002 et dirig par Bernard COMBETTES139, projet auquel nous avons contribu en proposant notamment les travaux que nous prsentons ci-aprs. Pour ces auteurs, il sagissait dtudier le fonctionnement de la transitivit partir dune champ smantique relativement homogne , en loccurrence les verbes de parole. En guise de dfinition, ils prcisent :

138

Nous admettons bien volontiers que les sens des verbes qui ne correspondent pas un prdicat de parole sont minoritaires et ne correspondent quaux emplois mtaphoriques de ces verbes. Notre propos est surtout de ne pas sparer les verbes de parole proprement dits de ceux qui ne sont verbes de parole que justement dans leurs emplois mtaphoriques (comme cest gnralement le cas entre autres catgories pour les verbes qui caractrisent les cris danimaux, aboyer, bramer, glapir, etc.). 139 PDR qui incluait, outre Bernard Combettes, Michel Charolles, Batrice Lamiroy et nous-mme, la participation active de Pierre Le Goffic et Laure Sarda ainsi que la participation occasionnelle de Jacques Franois, Morgane Snchal et Guillaume Jacquey.
149

Les verbes de parole () incluent dans leur reprsentation conceptuelle profonde un objet effectu, savoir les paroles produites. En effet, un verbe de parole est dfini ici comme un verbe ne satisfaisant pas au test : N0 V (E + (de + E) N1 + (de ce + E) Que P) sans dire ou crire un mot Prototypiquement, le sujet dun verbe de parole est de type Nhum, cest--dire agentif, alors que lobjet est au contraire inanim. Par ailleurs, la production de paroles est en gnral sauf exception, dans des cas comme dlirer, p.ex. une activit contrle par le sujet parlant, et tlique, puisquelle a la production langagire pour objet. Charolles & Lamiroy, 2002

En premier lieu, cette dfinition ne sappuie pas sur la thorie des actes de langage. Peu importe lintention du locuteur, ni mme la prsence ou non dun interlocuteur, ce qui compte est ici lactivit elle-mme, la production de paroles en tant quactivit. Comme Jamrozik, ils prcisent que le sujet doit tre de type NomHumain, bien que le mentionnant avec les prcautions prototypiques dusage. Aucune sparation prliminaire nest faite entre les verba dicendi proprement dits et les verbes au smantisme plus large. Charolles et Lamiroy admettent sans le dire que tout verbe dont une acception satisfait leur test syntaxico-smantique peut figurer dans la nomenclature. Cette dernire a t labore essentiellement partir des tables de Gross (1975). Leur nomenclature prsente lavantage de mettre tout de suite en avant une dichotomie verbes transitifs verbes intransitifs, en vertu de lanalyse initialement souhaite. Dans sa version la plus gnrique, la classe des verbes de parole sorganise autour de deux verbes noyaux, dire et parler, dont les caractristiques sont fort dissemblables : dire ne se conoit pas en principe sans un objet qui est le contenu de la parole ; parler est habituellement peru comme smantiquement intransitif, potentiellement porteur darguments. Bien que la dichotomie dire/parler soit la plus vidente pour caractriser le paradigme des verbes de parole, il existe dautres verbes permettant un dcoupage plus fin. Manguin, Franois et alii (2004) proposent la slection de six verbes susceptibles dexprimer une varit de modalits nonciatives140 : appeler, conseiller, crier, demander, dire, parler.

140

Par modalit nonciative , ces auteurs entendent un type de relation entre un locuteur, un allocutaire et/ou une dclaration, une injonction, une question, une requte ou simplement un propos de conversation. Cette dfinition implique la prise en compte des actes de parole en plus de la simple distinction contenu / activit propre la distinction entre dire et parler.
150

Partant des dfinitions prcdentes, nous avons souhait crire la notre le plus prcisment possible, mais en restant assez gnral afin de ne laisser chapper aucun verbe potentiellement de parole tout en excluant certains candidats douteux141. Les principes dtablissement de la grille que nous proposons sont conus pour une liste de verbes de parole assez diffrente de la nomenclature tablie par Charolles & Lamiroy (2002), laquelle contient environ 600 verbes rpartis entre deux catgories distinctes : intransitifs (150) et transitifs (+/- 450). Afin de constituer une nouvelle nomenclature, nous avons choisi de fonder notre slection sur le critre suivant : Pour un sujet smantique Humain ralis ou non, produire du langage humain142 dcodable oral ou crit . Ce critre comporte le sme de production de langage humain, et celui-ci doit tre explicite pour quun verbe soit retenu dans la liste. Comme Charolles & Lamiroy, nous considrons que les emplois ponctuellement introducteurs de parole de certains verbes comme haleter, postillonner, ternuer, etc. ne permettent pas ceux-ci dtre dsigns comme verbes de parole, dautant que les corpus littraires montrent que de nombreux prdicats sans rapport avec le langage peuvent introduire des paroles rapportes. Dans certains cas, les verbes slectionns ne sont pas des verbes de parole en tant que tels et ne le deviennent que par ajout darguments adapts (ex : tenir dans tenir des propos). Pour ceux-l, le sujet profond doit demeurer [+Humain] et ils peuvent se retrouver classs dans la catgorie Prdicats de parole composs ou Locutions verbales de parole selon leur degr dloignement du critre de base. Dans la mesure du possible, nous intgrons notre nomenclature des lexmes monolexicaux mais les prdicats de parole composs nen sont en rien exclus. Pour quun verbe soit retenu dans la nomenclature, il faut et il suffit quune au moins de ses acceptions soit reconnue comme respectant le critre gnral, ceci afin de ntablir aucune hirarchie a priori entre les prdicats de parole prototypiques et les autres. Le critre argumental que nous mettons en avant, pour un sujet smantique humain , doit tre augment des mdias de la parole exprims par mtonymie143 : journaux, radio, tlvision, etc. Plutt que sujet smantique , il faudrait ici parler d origine de la production de parole . De mme, sujet humain non ralis est comprendre au sens syntaxique ; en effet, il doit tre toujours possible de rtablir
141

Ce qui supposait de poser des critres suffisamment clairs et complets pour que le doute nait plus prise sur notre nomenclature. 142 Un sujet humain doit produire du langage humain : cette redondance est ncessaire car un humain peut, par imitation ou pour toute autre raison, produire du langage animal ou des sons qui nont rien voir avec du langage articul. 143 On rencontre quelques occurrences de ce type dans les textes littraires, le hautparleur qui hurle des ordres ou la radio qui braille des nouvelles pour les cas les plus simples.
151

smantiquement le sujet-agent du verbe de parole, soit explicitement dans la phrase (formes passives complment dagent144), soit implicitement (formes passives sans complment dagent145), soit extrinsquement la phrase (sujet ant-ralis146, etc.) Le critre principal produire du langage humain dcodable oral ou crit est peut-tre trop restrictif dans la mesure o certains verbes exprimant labsence de parole fonctionnent comme des verbes de parole produite. Par ailleurs, la forme ngative de la plupart de ces verbes permet de crer un prdicat verbal de parole : taire/ne pas taire, cacher/ne pas cacher, dissimuler/ne pas dissimuler. Aussi, si ne pas dire est analys au mme titre que dire, il apparat pertinent dtudier taire au mme niveau que ne pas taire147. Concernant notre corpus, le parti pris initial tait dy faire figurer les formes ngatives de ces verbes qui fonctionnent lenvers , mais il est videmment difficile den occulter la forme affirmative dans lanalyse. De tous ces commentaires, nous extrayons la dfinition finale que nous proposons et qui a t adopte dans les grandes lignes par nos collgues : Pour un sujet smantique +Humain ralis, exprim par mtonymie ou rcuprable comme agent dune forme passive, un verbe est potentiellement un verbe de parole si une au moins de ses acceptions se rapporte explicitement la production de langage humain dcodable, oral ou crit, y compris pour une forme ngative dudit verbe et dans le cas o le verbe sert de support un objet conforme un contenu de parole, hors paroles rapportes. Les verbes utiliss en incise ou comme introducteurs de paroles rapportes, et ntant pas dans leur dfinition mme des verbes de parole selon les critres retenus, ne figurent pas dans la nomenclature finale. Exemple tir de Frantext :
()papier pour y inscrire au crayon - on nous le fournirait - le numro de chaque wagon destin l'O..T. - Les numros sont l, vous voyez ? Nos yeux absents, abrutis. Herr Lindt toussota : - C'est un peu... imprvu pour vous, n'est-ce pas ? Mais c'est la guerre, la guerre ! () Schreiber Boris /Un silence d'environ une demi-heure/1996

moins dune indication contraire dans le dictionnaire, toussoter nentre pas dans la nomenclature en tant que verbe de parole puisquil ne satisfait pas la condition smantique initiale. De nombreux autres verbes, comme ternuer, se moucher peuvent voquer la parole par analogie et introduire de la parole sans surprendre le lecteur. Toutefois, avoir initi du langage dans le corpus nest pas un critre suffisant pour tre
144 145

Il a t dit par le prsident quil ferait beau demain. Il a t dit quil ferait beau demain. 146 Dans certains cas de discours direct ou indirect libre notamment. 147 Ctait du moins lavis unanime des membres du PDR sur la question.
152

considr comme un verbe de parole148, dautant que tous les verbes nous paraissent avoir le potentiel suffisant pour jouer ce rle, avec un minimum dimagination :
Bonjour, ferma-t-il la porte. (suggr lors dune runion du groupe ILF transitivit , 2004)

tant entendu que les nomenclatures existantes ne prsentent pas de manire exhaustive tous les verbes de parole respectant nos critres, tant donn par ailleurs quil nexiste pas de moyen automatis de les rpertorier lexicographiquement ou par le corpus, nous avons choisi en dernier ressort de faire une recherche systmatique dans le dictionnaire en lisant un un tous les articles. Bien que particulirement coteux en temps et en nergie, ce travail de fourmi est probablement le seul mme de nous permettre daboutir lexhaustivit dans la construction de nos bases, limage de la construction des Lexiques Inverss prsente au dbut de ce chapitre. Au final, nous avons extrait 869 verbes de parole dont la liste est prsente cidessous. Il est noter quune fois encore la slection que nous avons opre sappuie exclusivement sur les donnes proposes par le dictionnaire. Ce faisant, nous excluons ventuellement certains verbes rares et nous en acceptons certainement dont les emplois en tant que prdicats de parole sont dsuets ou un peu forcs. Conformment la manire dont nous lavons constitue, cette nomenclature se prsente initialement sous la forme de plusieurs sous-listes : verbes intransitifs, verbes avec objets directs syntagmes nominaux, verbes avec compltives149, verbes et complments dobjet indirect syntagmes prpositionnels150. Chaque verbe peut apparatre dans plusieurs des sous-listes mais nest prsent quune fois dans la nomenclature rcapitulative ci-dessus. Nous faisons remarquer que la prsence de prpositions et de complmenteurs dans la liste finale correspond la faon dont le dictionnaire rpertorie le prdicat en tant que se rapportant la parole : par exemple, tourmenter na pas dacception de verbe servant dnoter la production de parole, celle-ci nest rcuprable que derrire la sous-entre tourmenter de. Le point de dpart notre analyse de la classe des verbes de parole repose sur une intuition pralable. En effet, Jamrozik (1992) et Charolles & Lamiroy (2002) tablissent des typologies de verbes fondes sur des proprits intrinsques, et en dduisent une sparation de facto entre les verbes transitifs et intransitifs.

148

Cela nempche pas une telle occurrence dtre considre comme un prdicat de parole et le lexme verbal comme un verbe introducteur de paroles rapportes. Nanmoins, cela noctroie pas ces verbes un sens habituel de verbes de parole susceptible dapparatre tel quel dans un dictionnaire. 149 Avec prcision du complmenteur. 150 Avec prcision de la prposition.
153

Pour notre part nous avons imagin, hors de toute observation dexemples attests, quil ny avait pas une distinction aussi tranche entre la classe des transitifs et celle des intransitifs. En poussant plus loin lhypothse, nous pensions que la plupart des verbes devaient entrer potentiellement dans les deux catgories et que seuls quelques-uns, les plus irrductibles, rsisteraient au phnomne dappartenance potentielle aux deux classes selon les emplois. Afin de vrifier cette hypothse, nous avons choisi une nouvelle fois dutiliser la base littraire FRANTEXT avec un objectif principal double : montrer que larticulation transitif versus intransitif nest pas le meilleur moyen de catgoriser les verbes de parole ; mettre en exergue lensemble des traits syntaxiques et smantiques propres chaque verbe en contexte. La prminence ventuelle de la forme sur la sens, et vice-versa, est un thme rcurrent dans notre recherche. Montrer que lun prime sur lautre ne fait pas partie de nos objectifs, ce qui nempche pas cette question de se poser avec acuit ds lors quil sagit de relever et de dcrire tous les phnomnes mis en uvre dans la caractrisation dune occurrence lexicale. Tout comme Jamrozik, nous considrons quil ny a pas de relation hirarchique entre les deux et que forme et sens constituent un tout infrangible caractristique de ce quest le langage humain. Dans le cadre dune analyse syntaxique puis syntaxico-smantique des verbes de parole en franais, nous arrivons assez facilement un dcoupage en seulement une dizaine de constructions possibles, en effectuant des regroupements le cas chant. La liste probablement exhaustive des constructions observes dans le corpus est la suivante, exemples lappui : Schmatiquement, les verbes de parole sont susceptibles de sous-catgoriser trois grands types darguments : qui ou quoi les paroles sont adresses, quel est le contenu ou le thme des paroles produites et comment ou avec quels matriaux les paroles sont profres. Cette trichotomie nous a conduits, sur notre proposition personnelle et avec laval critique du PDR, dfinir les trois classes suivantes : interlocuteur, le destinataire de la parole ; contenu, comme son nom lindique se rapporte au contenu des paroles, de quoi on parle, quel est le thme du discours ;

154

mtalangage, qui donne une information sur la forme mais pas directement sur le contenu des paroles produites. A ces trois classes, il faut sans doute ajouter lorigine du discours, le sujet smantique voqu prcdemment, lequel est aussi un argument des verbes de parole et peut galement tre ralis sous la forme dun complment dans les constructions passives, do la cration dune quatrime classe : locuteur, le destinateur, lmetteur du discours. La grille danalyse syntaxico-smantique et les rsultats de lanalyse effectue dans ses cases sont prsents en annexe. Ralise sous tableur Excel, la grille danalyse est constitue de quatre soustableaux dcrits sparment : le tableau syntaxique pour la nature du sujet, des complments et ventuellement des circonstants, ainsi que des informations plus spcifiques propos des pronoms ou des prpositions le cas chant ; le tableau smantique des objets conformment ce que nous avons dcrit plus haut ; le tableau smantique du verbe qui se rapporte aux informations non syntaxiques portes par le prdicat verbal indpendamment de ses arguments151 ; le tableau tymologie152. Afin de rpondre une remarque qui nous a t faite plusieurs fois, nous prcisons que cette grille danalyse na pas t ralise dans lignorance des tables de Maurice Gross, et nont pas davantage comme objectif de les supplanter, ni mme de les concurrencer. Le fait davoir voulu laborer nos propres outils rsulte de trois paramtres accepts par lensemble des membres du projet ILF dont nous donnons la liste par ailleurs : dune part, il est plus ais pour nous de coder les informations lies aux verbes tudis dans un format qui nous est personnel ; deuximement, nos critres syntaxiques sont adapts la structure argumentale des verbes de notre nomenclature, comprenant le discours indirect, les paroles rapportes, les didascalies, etc., et excluent de facto les formes non rencontres ; enfin, notre grille propose galement le codage
151

Cette partie a t dveloppe par Michel Charolles et Batrice Lamiroy dans les travaux prliminaires du PDR. 152 Ralis par Bernard Combettes.
155

de critres smantiques (nature des objets), pragmatiques et tymologiques que les tables de Gross ne prsentent pas. Par surcrot, la forme des grilles et leur support progiciel permettent denvisager tout ajout et toute modification jugs utiles lors de lanalyse. Le nombre trs lev des verbes de parole en franais ne nous a pas permis deffectuer une synthse complte des donnes lexicographiques les concernant153. Toutefois, lintrt dobserver le paradigme dans son ensemble rside davantage dans les disparits et les similarits de leurs structures argumentales smantiques, et dans les constructions syntaxiques attenantes. A loppos, le cas dun verbe comme traverser (cf. Haton & Mascherin 2005) est beaucoup plus facile envisager dans la mesure o ce verbe ne possde quune seule structure argumentale profonde, Sujet-Verbe-Objet direct. Consquemment, lanalyse que nous avons faite de traverser tait essentiellement smantique, les donnes syntaxiques nintervenant que pour la description ventuelle doccurrences complexes, par exemple les sujets de mtaphores sous la forme de compltives infinitives ou de subordonnes. La pr-analyse du corpus a confirm notre hypothse de dpart, savoir que la plupart des verbes de parole sont susceptibles dtre utiliss dans des formes transitives. Toutefois, les diffrences de frquence dans lapparition de ces formes sont assez nettes et mritent une attention particulire. A titre de premier exemple, nous citerons le cas du verbe aboyer, strictement intransitif pour ses emplois habituels (cri du chien) et galement classifi comme verbe de parole intransitif par Charolles et Lamiroy. Les occurrences daboyer comme verbe de parole dans les textes littraires sont trs majoritairement transitives, avec des constructions syntaxiques trs diverses :
Le chauffeur venait d'opter pour le grand escalier quand une concierge aboya : L'escalier de service, c'est pour les chiens? Sabatier Robert/Trois sucettes la menthe 1972 Ils ne ragissaient pas du tout, elle tira le premier, colla une petite bourrade au second, les enfourna dans le jardin. Et vous allez voir ce que vous allez voir! aboya-t-elle, elle regarda vers la route. Rochefort C. /Encore heureux qu'on va vers l't 1975

153

Notons toutefois que nous avons dpouill les donnes dun nombre important de verbes, en particulier pour ceux qui ont des contenus smantiques explicites comme les verbes de cris danimaux. Nous disposons ainsi dune grille syntaxico-smantique remplie pour quelques milliers doccurrences. Bien que les conclusions que nous prsentons ici soient trs gnrales, elles sont issues de lobservation dun nombre important de donnes analyses ou vrifies par nos soins.
156

C'est le numro ct... Nettement moins brique, la courette... Nous revoil entre murs et dbris de la rpression de base... Un kpi mprisant m'aboie le chemin. Degaudenzi Jean-Louis /Zone 1987 Il appuya sur l'interphone, aboya une des secrtaires de prparer la lettre de licenciement de la "mal-baise de l'entre, me souviens pas de son nom" Vergne A. /L'Innocence du boucher 1984

Il y a encore quelques annes, le sens daboyer en tant que verbe de parole tait presque totalement ignor des dictionnaires. Depuis peu, cette acception est apparue (encore un peu plus tard dans les ouvrages bilingues), et depuis lan dernier au moins deux dictionnaires font tat dun transitif indirect aboyer contre/aprs fonctionnant pour les chiens comme pour les humains. En ce domaine, on voit bien que lusage prcde, et de loin, la grammaire et le lexique normatifs. Une telle richesse syntaxique se rencontre pour la plupart des verbes de cris danimaux qui deviennent mtaphoriquement des prdicats de parole humaine, lesquels sont abondamment reprsents dans la base littraire. De notre point de vue, cela est probablement d au fait quil sagit de verbes qui ntaient pas prvus pour cela leur apparition, ce qui laisse une certaine libert dans leurs emplois ultrieurs ds lors que la mtaphore est lexicalise. On voit bien pour aboyer que les contraintes habituelles sur les verbes semblables dire dune part et ceux semblables parler dautre part ne sappliquent pas. Selon les cas, aboyer peut tre assimil lun ou lautre de ces deux verbes dominant le paradigme. Il est galement possible de le rapprocher des autres verbes de rfrence proposs par Manguin et Franois (2004), appeler, conseiller, crier et demander avec une prfrence marque pour le troisime, crier, ce qui peut sexpliquer par les liens proposs par les dictionnaires de synonymes qui ont servi de base aux travaux du CRISCO sur la synonymie lexicale : tous les verbes se rapportant aux cris danimaux (hurler, beugler, brailler, braire, bramer, criailler, glapir, piailler, rugir) se retrouvent comme synonymes de crier et daucun autre des cinq verbes de rfrence. Notons qutonnamment aboyer nest pas prsent dans cette liste. Le phnomne que nous relevons pour aboyer vaut pour presque tous les verbes de la mme famille dans FRANTEXT. Cela est galement le cas pour les verbes dits dlocution ou ceux qui dune manire gnrale se rapportent explicitement au contenu de la parole dans le lexme verbal. Cette classe a pour particularit de vhiculer ses propres circonstants affectant la parole . Dans ses emplois en tant que verbe de parole, aboyer renvoie ainsi dire en aboyant aussi bien qu parler en aboyant, voire appeler/ ?conseiller154/demander en aboyant ou crier comme en aboyant.
154

Contrairement aux autres verbes de rfrence choisis par lquipe du CRISCO, conseiller semble assez mal fonctionner pour gloser les emplois du verbe aboyer, sans
157

Il ne faut pas occulter quun des cueils une tude globale des verbes de parole est la sous-reprsentation de certains dentre eux dans FRANTEXT. On ny dnombre aucune occurrence pour de nombreux verbes comme criticailler, crivailler, joualiser, pindariser, rciproquer, etc., ce qui rend impossible leur classification autrement quen suivant les donnes des dictionnaires. Par ailleurs, de nombreux autres verbes de parole sont peu reprsents (moins de dix occurrences), soit parce quil sagit de verbes rares, soit parce quils ne sont pas souvent employs avec lacception de production de parole. Pour ceux-l galement, il nest pas vident de tirer des conclusions linguistiques pertinentes. La conclusion qui simpose nous la lecture des rsultats obtenus est que la plupart des verbes de parole bien reprsents dans la base FRANTEXT peuvent tre manipuls indiffremment selon les deux schmes de la dichotomie prcite. Seuls quelques verbes irrductibles (comme bavarder) ne peuvent tre utiliss que dans lune des deux formes. Consquemment, le dpouillement du corpus nous permet de dgager une nouvelle rpartition des verbes selon de nouveaux critres moins restrictifs quune simple opposition activit/contenu, lactivit de parole tant propre au verbe parler et le contenu se rapportant largument second de dire. Toutefois, bien quil soit particulirement riche en occurrences originales et apparemment pertinentes, nous estimons que le corpus ninduit pas de jugement premptoire sur leur caractre valide ou invalide au sens linguistique. En revanche, il constitue lvidence un excellent indicateur de productivit lexico-smantique, en cela que les auteurs - et les locuteurs dune langue en gnral - peuvent employer nombre de mots dans des acceptions et des constructions intelligibles que les grammaires traditionnelles et la lexicographie ne prvoient ou ne mentionnent pas, repoussant ainsi les limites du possible et de limpossible langagiers (cf. Bronckart 2000, Rousseau 2000). De fait, un corpus actualis, comme lest FRANTEXT, est un bon indice de lvolution du lexique, dautant plus que les dictionnaires et les grammaires voluent et senrichissent son contact (il suffit dobserver la ractualisation permanente des acceptions dans le Petit Robert pour sen convaincre). Lanalyse des verbes de parole fait ressortir essentiellement de nouvelles constructions syntaxiques155. Dans ce cas, il ny pas lieu de modifier les structures dans lalgorithme que nous envisageons et allons incessamment dcrire ; il suffit denrichir la base de donnes pour les prendre en compte. Le traitement de ces nouvelles donnes trouve sa particularit dans le fait quaucune traduction nest slectionne ni aucun synonyme en langue source
doute cause de limpossibilit de trouver une connotation ngative conseiller et a contrario une connotation visiblement positive aboyer. 155 Les constructions syntaxiques dites nouvelles sont directement perceptibles. En revanche, il nest pas ais de mettre en exergue des sens nouveaux pour lensemble des verbes.
158

directement perceptible puisque nous travaillons sur une base littraire du franais sans renvoi dautres langues et sans paraphrase ou glose accessible. De ce fait, les structures qui en dcoulent sont implantes dans le graphe sans lien initial de synonymie. Lintrt davoir des structures isoles rside dans la possibilit denrichir le graphe de manire collaborative ou indirectement par le jeu du miroir lexicographique. Nous pouvons galement tenter de lenrichir nous-mme par le biais de notre seule intelligence, avec les risques que ce la comporte. Prenons le cas du verbe bramer, majoritairement transitif dans le corpus FRANTEXT (en tant que verbe de parole) mais strictement intransitif daprs nos dictionnaires bilingues. Daprs ces derniers, les traductions anglaises de ce verbe sont to bawl (brailler comme synonyme LS156) et to wail (se lamenter comme synonyme LC157). Par enrichissement collaboratif, il est envisageable de proposer un utilisateur de nos bases toutes les traductions de bramer et leurs quivalents dans le miroir. Un locuteur du franais naura aucun mal dterminer que brailler est potentiellement transitif direct alors que se lamenter lest beaucoup plus difficilement. To bawl apparat dans ce cas comme la meilleure traduction pour une occurrence telle que :
() elle resurgit toujours, intacte, aprs avoir bram pendant trois jours que la vie lui est insupportable () (Dormann Genevive / La Petite main /1993).

Par le jeu du miroir, nous remarquons que to bawl (la premire traduction) est potentiellement transitif, ainsi que brailler. Par ailleurs, se lamenter et to wail sont tous les deux intransitifs, ce qui nous conforte dans lide que les premiers sont les plus appropris pour la traduction dune occurrence telle que ci-dessus. Les constructions et les sens qui napparaissent pas dans les dictionnaires qui nous servent construire la base de donnes peuvent tre incluses de la manire suivante :
Figure 9 : Fragment de CSMU pour les verbes de parole partir de donnes attestes
mot- mot-cible source syn LS syn LC colloc objet colloc sujet constr LS constr LC registre infos complmentaires

Faboyer Faboyer

Humain Humain

Objdiscours indirect Objdiscours rapport,

Production de parole Production de parole

156

Synonyme en langue source, dont nous donnons la dfinition par ailleurs ainsi que dans le glossaire des acronymes en fin de document. 157 Synonyme en langue cible, dont nous donnons galement la dfinition par ailleurs ainsi que dans le glossaire des acronymes en fin de document.
159

incise Faboyer Faboyer Faboyer Faboyer Fbramer Abawl Fbramer Awail Brailler Se lamenter [contenu de parole] Humain [contenu de parole] [contenu de parole] [contenu de parole] Humain Humain Humain Humain Humain Humain obj De Inf Que Prop Que Prop That Prop / to vb Production de parole Production de parole Production de parole Production de parole Production de parole Production de parole

Rien nexclut a priori de laisser vierges les cases de traductions dans la mesure o la base de donnes est destine demeurer ouverte tout enrichissement ultrieur. Avec un peu daudace, nous aurions peut-tre pu remplir le champ mot-cible en jouant sur les variations possibles du verbe anglais to bark. Cependant, nous estimons que cela nest pas notre rle dans le cadre de ce sujet. ce sujet, nous pouvons poser la question des mmoires de traduction qui existent pour de nombreuses uvres littraires traduites ainsi que les ressources des aligneurs multilingues qui contiennent des donnes de nombreuses sources qui ne respectent pas la lettre les grammaires et les dictionnaires. Ce que nous saisissons dans nos bases est un ensemble de mmoires de faits de langue pour les exemples attests et des mmoires de correspondance interlangue pour les donnes lexicographiques. Lapport des aligneurs et des mmoires de traduction lensemble permettra denrichir les premires et ventuellement de valider les secondes. Pour ce qui concerne aboyer en tant que verbe de parole transitif, il existe des traductions rpertories dans des concordanciers bilingues qui sont gnralement to snail at (littralement : montrer les dents devant//contre), ce qui tait imprvisible partir de nos connaissances de la langue ou des donnes des dictionnaires. De ce fait, nous pensons que lutilit de conserver la mmoire des faits de langue non traduits est grande, et lintrt de travailler ultrieurement avec des aligneurs/concordanciers de textes le sera tout autant.

160

CHAPITRE III tude autour du verbe traverser. Complments et complmentarit des donnes contextuelles et lexicographiques.

161

1. La version lexicographique de traverser 1.1 Des acceptions de traverser 1.1.1 Traverser ressemble aborder
Comme pour aborder au chapitre II, nous remarquons la prsence dans les significations de traverser de deux acceptions concurrentes en tant que verbe de mouvement (avance ou perce dynamique), ainsi quune acception mtaphorique principale motive par les prcdentes (traverse dune priode temporelle). Cependant, traverser admet des emplois statiques plus rcents, lesquels sont incompatibles avec les emplois daborder qui sont exclusivement dynamiques ou apparents, y compris dans les sens mtaphoriques si lon admet une certaine abstraction dans la conceptualisation du mouvement. Par ailleurs, traverser sert galement pour des occurrences de parcours temporels, ce quencore une fois aborder admet plus difficilement mme sil semble tout fait possible daborder une crise ou une priode dun type particulier, ce qui induit une avance du temps (avec aspect ingressif) au mme titre que les traverses. En outre, lintrt dtudier traverser rside dans les nuances aspectuelles que les diffrents emplois du verbe font apparatre, et dans linfluence que ces nuances ont sur le choix de la bonne traduction en contexte. Les premiers verbes que nous avons prsents auparavant nont pas la mme subtilit dans la caractrisation de laspect, bien que leurs emplois nen soient pas dnus pour autant.

1.1.2 Histoire du verbe


1.1.2.1 volution des acceptions du verbe Donnes issues une nouvelle fois du TLF :
tymol. et Hist. A. 1. Fin Xe s. fig. percer de part en part (Passion, d. d'Arco Silvio Avalle, 338); 2. 1580 se frayer un passage au travers (GARNIER, Antigone, d. W. Foerster, III, p. 58); 1839 fig. pntrer subitement au plus profond de l'tre (BALZAC, Batrix, p. 201); 3. 1718 part. pass avoir les vtements mouills jusqu' la peau (Ac.). B. 1. Ca 1100 traverser un pont (Roland, d. J. Bdier, 2690); 2. ca 1140 parcourir un espace d'un bout l'autre (Plerinage Charlemagne, d. G. Favati, 101); 3. 2e moit. du XIIIe s. franchir dans le sens transversal quelque chose qui s'tend en longueur (Gaufrey, 117 ds T.-L.); 4. a) 1580 (de choses sans mouvement) s'tendre, s'allonger au travers de (B. PALISSY, Disc. admir., p. 180); b) 1583 (de choses mobiles) se dplacer, aller travers (GARNIER, Les Juifves, d. W. Foerster, III, p. 163); 5. 1808 se trouver dans une priode caractrise par un certain tat (DELILLE, Trois rgnes, III ds LITTR); 1839 traverser les ges (LAMARTINE,
162

Recueillements potiques, I, XXV (d. Garnier, 1925) ds ROB. 1985). C. 1. 1174-76 fig. faire obstacle, s'opposer , empcher (GUERNES DE PONT-SAINTEMAXENCE, St Thomas, d. E. Walberg, 2363); 2. 1687 mettre en travers en faisant obstacle (BOSSUET, Louis de Bourbon ds LITTR); 3. 1694 traverser l'ancre (CORNEILLE); 4. 1913 alpin. (cho des Alpes, no 12, dc., p. 530 ds QUEM. DDL t. 27). D. Empl. pronom. 1. ca 1160 aller au travers de (Moniage Guillaume, 2084 ds T.-L.); 2. 1680 (en parlant d'un cheval) jeter la croupe d'un ct, la tte d'un autre (RICH.). Du lat. pop. traversare, lat. transversare remuer en travers , de tranversus, v. travers.

1.1.2.2 Historique des emplois des prpositions contenant travers Les historiques des locutions prpositionnelles intgrant le substantif travers sont galement instructifs, notamment parce quun prdicat verbal de type tre en travers de , passer travers , aller au travers de , etc., sont des paraphrases synonymes presque parfaits de traverser.
Prononc. et Orth.: [ ]. Att. ds Ac. dep. 1694. tymol. et Hist. A. 1. En travers158 a) ca 1100 en traver par un chemin de traverse (Roland, d. J. Bdier, 3239); b) 1160-74 en travers de part en part (WACE, Rou, d.A. J. Holden, III, 8273); 1885 fig. a me reste en travers (ZOLA, Germinal, p. 1231); c) 1691 mar. se dit de la position d'un btiment dont la direction de la quille est perpendiculaire la direction du vent ou du courant (OZANAM, p. 278); 1771 mar. mettre en travers (BOUGAINVILLE, Voy., II, p. 315 ds LITTR); 1876 s'chouer en travers (Lar. 19e); d) 1829 en travers de de manire contrecarrer quelque chose (DUMAS pre, Henri III, I, p. 1); 1834 fig. se mettre en travers de (BALZAC, uvres div., t. 2, p. 669); 1861 en travers du chemin (de qqn) (AUGIER, Effronts, pp. 373-374); e) 1847 dans une position transversale par rapport l'axe de l'objet considr (MRIME, A. Guillot, p. 90); 2. travers a) 1160-74 a travers (WACE, Rou, d. A. J. Holden, 1531); b) id. travers les chans (ID., ibid., III, 4467); 1606 travers les champs (NICOT);

158

Les soulignements ont t ajouts par nous a posteriori sur les donnes du TLF afin de faire apparatre dans le texte les occurrences pertinentes pour notre propos.
163

() 3. de travers a) ca 1155 en travers de (WACE, Brut, d. I. Arnold, 5310); ca 1200 d'une extrmit l'autre dans le sens de la largeur (Godefroy de Bouillon, 245 ds T.-L.); 1588 dans le mauvais sens, pas en place () 4. au travers de ca 1210 d'une extrmit l'autre dans le sens de la largeur (Folque de Candie, d. O. Schultz-Gora, 10477); 1561 au milieu de, parmi (J. GREVIN, L'Olympe, d. L. Pinvert, p. 281); 1667 par l'intermdiaire de quelque chose (RACINE, Britannicus, II, 2); (L'quipe, 26 sept. ds PETIOT 1982); () b) 1694 dfaut de ce qui n'a pas une ligne normale, de ce qui est dvi (Ac.); 1803 dfaut de l'acier dans le canon d'un fusil (BOISTE). Du lat. traversus, var. de transversus oblique, transversal ; fig. contrariant ; part. pass adj. de transvertere tourner vers, travers , transformer , dtourner .

1.1.3 Dgroupement des acceptions


Les acceptions de traverser dans un dictionnaire actuel du franais159 sont les suivantes : 1a- passer, pntrer de part en part, travers (un corps, un milieu interpos) 1b- fig : passer, pntrer de part en part, travers 2- se frayer un passage travers (des personnes rassembles) 3- parcourir dune extrmit, dun bord lautre (un espace) 4a- couper, aller dun bord lautre (une voie de communication) 4b- absolu : couper, aller dun bord lautre 4c- en parlant de choses mobiles : couper, aller dun bord lautre 5- choses sans mouvement : tre, stendre au travers de 6a- aller dun bout lautre de (un espace de temps) 6b- dpasser (un tat durable) 7a- se prsenter (lesprit) 7b- passer par (la tte) 8- quit : mettre de travers 9- vx : se mettre en travers de, sopposer

159

Il sagit ici du Nouveau Petit Robert. Le TLF nest toujours pas utilis pour le dgroupement pour les raisons nonces au sujet du verbe aborder.
164

1.2 Des traductions de traverser 1.2.1 Les traductions peu marques160 smantiquement
La traduction en anglais la fois la plus gnrique et la moins connote est to cross. Ce verbe ne semploie toutefois que pour les parcours statiques ou dynamiques sur des surfaces planes ou assimiles. Il ne convient pas pour traduire le verbe traverser lorsque celui-ci fait rfrence des transperces ou des traverses difficiles sur des terrains vus comme des entits en trois dimensions. Lanalyse linguistique fine que nous proposons dans la suite du chapitre mettra laccent sur cet aspect (au double sens du terme du mot) des choses. Pour la plupart des autres acceptions de traverser, le dictionnaire propose to go through comme candidat principal. Bien que commun un nombre important de sens de traverser, to go through est ostensiblement plus marqu que to cross de par la prsence de la prposition through, laquelle est une extension smantiquement pleine du lexme verbal. Nous dtaillerons les rles smantique et aspectuel de cette prposition et dautres au cours de ce chapitre, et de manire encore plus fouille dans la partie entirement consacre ltude de traverser en contexte langagier.

1.2.2 Les traductions marques161


Par lobservation du dictionnaire, les traductions plus spcifiques peuvent tre spares en deux catgories principales : les verbes monolexicaux dont le morphme principal smantiquement corrl au lieu o seffectue la traverse ; est

les verbes particule, contenant un verbe de dplacement (dans la plupart des cas) et une prposition qui vhicule un ou plusieurs aspect(s) particulier(s), en rfrence la configuration spatiale du terrain travers ou en fonction de laccomplissement ou non - au sens aspectuel de la traverse.

Par traduction peu marque , il faut comprendre un terme en langue cible qui ne porte pas de trait intrinsque, smantique ou aspectuel qui prolonge le sens habituel du verbe. (Voir ce sujet Traits Smantiques Intrinsques et de Prolongement, Chapitre I). 161 Par opposition aux traductions non marques , nous appelons traduction marque tout terme en langue cible qui porte dans sa structure prdicative des traits smantiques qui prolongent lacception du verbe quil traduit (TSI ou TSP). Il en est ainsi par exemple de to sail qui peut traduire traverser en prcisant explicitement le vhicule utilis pour la traverse, savoir un navire, et un support gographique, en loccurrence une tendue deau.
165

160

En termes de productivit, les verbes particule fusionns sont particulirement remarquables. Mme si le dictionnaire ne le mentionne pas toujours explicitement, il est fort probable que les prpositions through et across, et dans une moindre mesure over, peuvent servir de catalyseur pour la production lexicale de traductions de traverser partir de verbes qui ntaient pas ncessairement dvolus cette fin.

1.3 Comparaison LI / LD en anglais


Le lexique droit des traductions de traverser en anglais est relativement pauvre, eu gard la productivit tonnante des prpositions sus-cites. Cela tant, quelques exemples prsupposent une productivit importante des supports verbaux de mouvement, de dplacement et daction de faon gnrale. En revanche, on retrouve dans le LI un nombre plus lev de traductions grce notamment la grande productivit des prpositions de mouvement across et through et galement de over qui nest pas du tout reprsente dans le LD, certainement par la faute dun smantisme aspectuel trop appuy. Comme nous venons den faire lhypothse, beaucoup de verbes nayant pas dacception proche de celles de traverser peuvent tre traduits par ce dernier par ladjonction de la prposition approprie.

166

Figure 10 : tableau de correspondance des traductions anglaises de traverser

Dico droit

Indice T1 Indice T2 Dico invers


2 2 3-4a 3-4a amble through barge through be across beetle through belt across come across come through cross cross over cross under cut cut across cut right across ford get across get over get through go across go right through go through have across lie over live through make ones way through negotiate occur to pass through run across

Sens proche

Prolongement du sens
Dun pas tranquille En bousculant En vitesse toutes jambs, toute blinde

amble through barge through be across 5 beetle through belt across come across come through cross cross over cross under cut cut across cut right across ford get across get over get through go across go right through go through have across lie over live through make ones way through negotiate occur to pass through run across
162

= cross T2 1a 3-4a-4c-5-7 3-4 indfini162 3-4a 5 5 5 3-4a indfini indfini indfini indfini 1a 1a-6b-6a 5 6a 2 indfini 7 1-2-3-4 2-3-4-5 6b 5

= cross

cross par en-dessous cross, intersect

gu lit cross cross de part en part suffer, endure

passer travers cross come to mind en courant (LI)

7 6b 5

La mention indfini signifie que le dictionnaire ne prcise pas pour quels emplois de traverser ce dernier est la traduction du verbe concern. Cest notamment le cas pour les verbes qui sont assimils to cross par les rdacteurs mais cela najoute pas vraiment de prcisions sur les acceptions quils traduisent rellement.
167

run right 5 across sail shoot through 1a-1b stride across swim across travel down travel through undergo wade across walk across zigzag through 3 6a

3 2-3-4 3 3

run right across sail shoot through stride across swim across travel down travel through undergo wade across walk across zigzag through

en bateau une douleur / balle (sujet) grands pas la nage

6b 3-4a

4a indfini indfini

gu en zigzaguant

Comme ctait le cas pour abandonner et contrairement aux reprsentations du verbe aborder, ce tableau ne rend pas compte des diffrences lies la nature des arguments, surtout en ce qui concerne les complments dobjet. Par exemple, le dgroupement des acceptions dans le Petit Robert ne permet pas de montrer la diffrence de rpartition des traductmes entre to cross et to go through en rapport avec les acceptions 3 et 4 (a, b et c) alors que ces deux verbes apparaissent visiblement en distribution complmentaire dans le Robert & Collins. Le rle majeur jou par les collocations dans le choix de la traduction nest cependant pas suffisant pour reprsenter nos donnes de la mme faon que pour abandonner tant donn la polysmie trs marque de traverser par rapport au premier. Cest notamment ce dernier argument que nous mettons en avant pour justifier ltude linguistique particulire que nous avons mene avec Laurent Mascherin sur traverser. De faon gnrale, ce tableau (pourtant non exhaustif du ct du LI) donne une ide assez effrayante de la complexit du verbe traverser quant sa traduction eu gard aux possibilits offertes par le dictionnaire. Bien que ce verbe ne fasse pas partie des plus simples caractriser, il est trs reprsentatif dun phnomne gnralis lensemble des dictionnaires. 1.3.1.1 Essai sur traverser
Figure 11 : Fragment du tableau de donnes autour de traverser
motsource LS motcible LC synLS SynLC obj1 obj2 suj constrLS constrLC Registre infoscomp ls

traverser traverser traverser traverser

f f f f

atravesar cruzar traspasar calar

e e e e

cruzar atravesar calar traspasar

pays, rue pays, rue (manteau) (manteau)

168

motsource

LS

motcible

LC synLS

SynLC

obj1

obj2 suj

constrLS

constrLC

Registre

infoscomp ls

traverser traverser traverser traverser traverser

f f f f f

atravesar pasar pasar por cruzar por atravesar

e e e e e

pasar atravesar

(temps) (temps) lesprit la cabeza lesprit la imaginacion de part en part = de parte a parte 163 rue, pont, montagnes, mer ville, fort, tunnel rivire personne, vhicule personne, vhicule la nage en bac en bac gu gu grands pas pont, route pont, route tunnel

traverser

f f f f f f f f f f f

cross

traverser traverser traverser traverser traverser traverser traverser traverser traverser traverser

go through e swim across e take a ferry e across cross by e ferry e ford wade across e stride across e cross run across e e run across cross

cross by ferry rivire take a ferry rivire across wade across rivire ford rivire pice

cross under e

2. Vers une analyse plus approfondie de traverser en contexte


partir de notre pr-analyse du verbe traverser, il est vident quune tude strictement lexicographique, mme taye par lintuition, se rvle finalement insuffisante lorsquil sagit de distinguer des valeurs aspectuelles qui sont exprimes au-del du prdicat verbal. Or, ces valeurs jouent un rle non ngligeable dans la slection des vedettes appropries ds lors quon entend les traduire. Par ailleurs, les dictionnaires et les typologies classent les verbes en fonction de plusieurs critres borns : leurs acceptions (contextualises ou non), les collocations habituellement associes ces acceptions et leur syntaxe prototypique, dfaut dtre exhaustive. Sur ce point galement, labsence de prise en compte systmatique du contexte empche davoir une lecture complte du potentiel smantique et structurel des mots de la langue. Toutefois, nous constatons que lvolution des dictionnaires
163

Il sagit ici de la traduction de traverser de part en part par atravesar de parte a parte . La question est de savoir si traverser de part en part peut tre une lexie ou bien si de part en part nest rien de plus quune information complmentaire. Cette dernire vision est plus cohrente avec le sens de lexpression qui est bien conforme au sens originel de traverser , ainsi quavec son faible degr de figement.
169

contemporains tend vers une meilleure prise en compte de ces facteurs, et ce doublement : Tout dabord, les phrases exemples sont plus nombreuses et parfois attestes. Ensuite, les dictionnaires que nous consultons font entrer davantage les constructions syntaxiques et les acceptions nouvelles et mergentes, certes avec parcimonie, mais avec une cohrence qui sapproche davantage de lvolution littraire observe dans nos donnes textuelles. Afin de complter les donnes et leur ordonnancement que nous prsentons au dbut de ce chapitre, nous largissons nos travaux lexploration de la base littraire FRANTEXT164, avec un objectif clair : complter et enrichir les donnes lexicographiques tout en trouvant les moyens mettre en uvre pour que les donnes nouvelles sintgrent aux structures que nous proposons. Il nest pas question ici de remettre en cause le travail des lexicographes ni de le faire leur place mais simplement dassocier au format du dictionnaire des analyses linguistiques sur donnes attestes permettant davoir un regard critique et objectif sur certains phnomnes linguistiques. Nous discuterons un peu dans ce chapitre de la validit ou de lutilit suppose dune analyse partir des corpus en ne perdant pas de vue que les caractristiques de ces derniers varient grandement dune base lautre. Ces questions ont t traites dans le chapitre II et seront partiellement reprises au chapitre conclusif qui dresse le bilan de nos recherches et des outils que nous avons utiliss ou crs pour les mener. Avant tout, quelques remarques simposent au sujet de la base littraire FRANTEXT : Il sagit en premier lieu dune base historique, cest--dire quelle comprend des textes littraires depuis lorigine de la langue franaise jusqu nos jours. Sa finalit est avant tout de servir lensemble de la communaut linguistique et littraire, quil sagisse des diachroniciens ou des synchroniciens, des exgtes ou des grammairiens. Ensuite, la base est paramtrable lenvi. Il est ainsi possible et facile de choisir la priode sur laquelle nous souhaitons travailler ainsi que le type de textes explorer. Pour notre part, nous avons slectionn les textes de toutes origines postrieurs 1960, conformment la

164

Pour une rflexion globale sur la place des corpus en linguistique, voir en fin de chapitre II.
170

dcision prise dans le cadre du projet ILF transitivit dirig par Bernard Combettes et auquel nous avons particip activement. FRANTEXT est une base de donnes textuelles initialement cre pour tayer le travail des lexicographes chargs de rdiger les entres du TLF. On estime que la base a nourri prs de 90 % des exemples du dictionnaire fait lINALF entre 1963 et 1993. Sa finalit premire tait par consquent dalimenter un ouvrage lexicographique qui se devait dtre le reflet le plus fidle du franais littraire des 19me et 20me sicles. lorigine, la base ne contenait que des uvres ou des textes des deux sicles prcits. Puis, petit petit, elle a t enrichie duvres plus anciennes (pour les travaux en langue ancienne raliss lATILF) ou plus rcentes en fonction des besoins ponctuels des chercheurs. FRANTEXT contient peu prs 80 % duvres romanesques et 20 % de textes scientifiques, techniques voire philosophiques. A ce jour, elle comporte 3747 textes en franais du 16me au 21me, 218 textes des 14me et 15me ainsi que 22 textes mdivaux. Cette somme duvres numrises reprsente 1,5 milliard de caractres et environ 218 millions doccurrences de mots. Les textes prsents dans la base sont tous intgralement numriss et baliss partir de leur dition originale. Il est possible dinterroger la base sur nimporte quel mot flchi (pour la version intgrale) ou sur un lemme (pour la version catgorise). Grce au programme STELLA mis au point par Jacques Dendien lINALF, de nombreuses possibilits de paramtrage sont offertes, en particulier le choix de la priode vise, celui des thmes littraires, la possibilit de consulter des co-textes plus ou moins tendus, etc. Il est galement possible de crer automatiquement des listes ou dcrire des grammaires formelles pour faciliter la recherche. Enfin, la base est enrichie en permanence. Les chiffres que nous avons prsents sont fort susceptibles davoir augment depuis leur saisie car le travail de numrisation seffectue ponctuellement et continuellement, la demande des chercheurs et des circonstances (textes pour lagrgation ou pour des colloques). Le hasard des participations a fait que nous avons tudi les verbes en corpus dans deux contextes tout fait diffrents. Tout dabord, nous prsentons la varit aspectuelle du verbe traverser et de ses traductions probables partir de donnes littraires. Par ailleurs, nous avons trait dans le chapitre prcdent le comportement des prdicats verbaux en contexte partir dune nomenclature beaucoup plus large : celle des verbes de production de parole. la fin de cette troisime partie, nous proposerons une synthse des donnes recueillies et analyses dans le but de les confronter et, idalement, de les faire fusionner avec les donnes lexicographiques.

171

3. Pourquoi complter les donnes par le corpus 3.1 Une question qui divise ou qui anime la communaut
Depuis quelques annes la linguistique semptre dans un dbat mthodologique autour de la question des faits de langue associs aux thories ou aux outils. Il a t notamment reproch aux linguistes sans corpus de construire des exemples ad hoc en fonction de leurs besoins personnels dun point de vue thorique au mpris de la ralit du langage (cf. Kleiber 1997). Lenjeu central de cette polmique est de parvenir rpondre la question : peut-on finaliser des ides ou des thories linguistiques sans recourir des occurrences attestes du phnomne que lon traite ? En marge de ce dbat, rappelons les tenants du travail lexicologique de Meluk, Polgure et alii, lesquels ont fond leurs reprsentations sur des donnes intuitives et le revendiquent. Outre que de nombreux congrs et colloques fleurissent un peu partout ces dernires annes sur la question, nous trouvons galement un grand nombre douvrages reproduisant la discussion lchelle de la communaut. Dans Ooi (1998), nous trouvons la dfinition quasi-originelle de la linguistique de corpus selon Sinclair (1996), lequel propose une caractrisation de cette linguistique mergente par la distinction entre ltude dirige par le corpus et la linguistique fonde sur le corpus. Une troisime voie est galement envisageable, comme nous lavons suggr au chapitre II en ce qui concerne la linguistique applique au corpus. la suite de cette dfinition presque pionnire, des ouvrages plus rcents ont mis en vidence la querelle sous-jacente qui oppose dirrductibles partisans du tout-attest de non moins irrductibles partisans de la construction de donnes, ces derniers tant gnralement plus discrets dans la polmique.

172

3.2 Le plus beau corpus du monde ne peut donner que ce quil a165
Durant notre participation166 au colloque JETOU 2005 consacr au corpus, son rle et son utilisation, nous avons insist sur la complmentarit des modes dobservation des donnes exploitables :
() Toutefois, bien quil soit particulirement riche en occurrences originales et apparemment pertinentes, nous estimons que le corpus ninduit pas de jugement premptoire sur leur caractre valide/invalide au sens linguistique. En revanche, il constitue lvidence un excellent indicateur de productivit lexico-smantique, en cela que les auteurs - et les locuteurs dune langue en gnral - peuvent employer nombre de lexies dans des acceptions et des constructions intelligibles que les grammaires traditionnelles et la lexicographie ne prvoient ou ne mentionnent pas. De fait, un corpus actualis, comme lest FRANTEXT, est un bon indice de lvolution du lexique, dautant plus que les dictionnaires et les grammaires voluent et senrichissent son contact (il suffit dobserver la ractualisation permanente des acceptions dans le Petit Robert pour sen convaincre). En dfinitive, toute notre tude nous fait tendre vers une mme conclusion : les corpus, les grammaires, les dictionnaires et lintuition sont tous des outils danalyse pertinents et indissociables ; et il nous parat peu judicieux de prtendre porter un regard exhaustif et premptoire sur la langue sans en observer tous les paramtres, quils relvent de la norme ou de lusage, lun influenant lautre et inversement dans lavance du temps. Haton, 2005

Ce point de vue dlibrment candide, mais ne ltant videmment pas au fond, a t bien accueilli lors de cette prsentation, ce qui a renforc notre dtermination pratiquer une linguistique mixte . La discussion finale na pas apport davantage dclairage sur la validit de la linguistique de corpus mais ce qui nous a frapp est labsence de consensus mou qui se dgage du dbat. En dfinitive, nous nous plaons volontiers dans une position intermdiaire la dualit propose par Sinclair : nous sommes pour une linguistique appuye par le
On retrouve semblable pigraphe, la plus belle fille du monde ne peut donner que ce quelle a dans larticle de Corbin, Corbin, Tutin & Aliquot (1996) qui commentent et critiquent les perspectives dinformatisation du TLF. Selon ces auteurs, () le TLF informatis ne pourra finalement rpondre aux requtes des linguistes qu la mesure de ce que ceux-ci auront t capables de lui donner en pture. Le vu final de Corbin & alii est que ce produit puisse voluer de telle sorte que les versions ultrieures soient susceptibles dintgrer des connaissances nouvelles quil aura peuttre contribu faire acqurir. La question se pose ncessairement de la mme faon pour tous les corpus. 166 Transitivit, emplois prototypiques et crativit langagire : comment un corpus littraire rorganise la typologie des verbes de parole en franais . Article paru dans les actes des journes JETOU 2005 sur la linguistique de corpus.
173
165

corpus, lequel permet de vrifier des hypothses et des rsultats intuitifs ou issus dautres catgories doccurrences (construites ou lexicographiques), et aussi pour un prolongement motiv par la remise en cause des hypothses initiales partir de lobservation des donnes attestes. Cest ce point quil faut tre particulirement vigilant : la remise en cause des thories dorigine ne doit pas occulter le caractre spcifique du corpus observ. En effet, un corpus littraire ne peut avoir dautre prrogative que dillustrer la crativit des auteurs, et ainsi de servir dindicateur du potentiel de la langue, comme nous lavons dit par ailleurs. Cette prudence de circonstance ne rsout toutefois pas le problme : ce nest pas parce que le corpus nest rien dautre que ce quil est quil ne doit pas servir de rfrence. La question peut en fait tre retourne : quest-ce qui fait quun ensemble de donnes construites ne constitue pas un corpus acceptable ? Il est donc trs clair que la question de lopposition entre les donnes construites et attestes est dsormais centrale en linguistique. Nous ne saurions adhrer littralement au jugement de Grevisse et Goosse (1993), qui considrent quon ne doit pas confier les rnes de la grammaire aux auteurs littraires qui ne sont pas des locuteurs trs srieux ni trs fiables de leur point de vue ; sans aller non plus vers un groupement tout-corpus tout prix qui semble jauger avec mfiance les linguistes qui ont encore loutrecuidance de se construire des exemples sans se proccuper de lusage, nous nous poserons la simple question : Peut-on considrer quun linguiste est moins bon locuteur de sa propre langue quun crivain, quun journaliste ou que quelque autre auteur (selon le corpus utilis) ? La rponse est non, bien entendu. Cependant, il peut tre tentant pour un linguiste dadapter ses exemples aux phnomnes quil souhaite faire merger. Cest dailleurs partir de ce phnomne dadquation (inconsciente ?) que la polmique nat. Dautre part, la multiplicit des auteurs semble garantir quil ny a justement pas de jugement port sur la langue qui ne provienne dune seule source scripturale. Pour cette dernire raison, nous avons dcid dinclure le plus petit nombre possible doccurrences construites dans ltude. On trouvera tout de mme quelques exemples de ces dernires pour illustrer des phnomnes trs particuliers lis aux verbes que nous analysons, ce qui nempche pas la circonspection vis--vis deux puisque nous avons probablement fait comme tout le monde : nos exemples construits sont sans nul doute ad hoc.

4. Traverser dans le corpus 4.1 Introduction la traverse


Comme nous lavons montr pour les seules donnes lexicographiques, le verbe traverser en franais est lobjet de nombreuses traductions en anglais. Dans cette partie, nous chercherons dterminer dans quelles mesures les traductions de ce verbe correspondent aux dimensions temporelles et spatiales quil exprime ; plus
174

prcisment encore, nous chercherons illustrer par le corpus quelles sont les donnes co-textuelles qui contraignent smantiquement le prdicat verbal, ainsi que les traductions associes chaque occurrence. Avant toute chose, ltude est ouverte par lcriture dune typologie ontologique des diffrents emplois du verbe issue de donnes attestes dans les textes littraires. Cette ontologie ne saurait tre exhaustive dans la mesure o sa constitution illustre avant tout la grande variabilit des parcours concrets ou non que le sujet traversant peut effectuer au sein ou au travers de lobjet travers. Ceci effectu, nous articulerons cette tude autour de trois axes. Le premier concerne la reprsentation en de du verbe traverser des concepts de mouvement et de bornage. Le second ouvre ltude vers une reprsentation et une modlisation de la structure spatio-temporelle de ce verbe en fonction de facteurs intrinsques et extrinsques. Le troisime concerne le rapport langlais des diffrents sens de traverser en contexte grce au relev des critres dterminatifs de laspect que nous aurons effectu. Le mouvement est le concept de base du verbe traverser dans la plupart de ses emplois non mtaphoriques. Il permet deffectuer une premire distinction entre les emplois qui induisent une traverse dynamique et les tats au sens aspectuel. Par ailleurs, les emplois non spatiaux plus ou moins mtaphoriques peuvent tre ramens des emplois statifs et tre modliss comme tels au sein dun espace n-dimensionnel. En effet, de rares exceptions prs (que nous ne ngligerons pas), le verbe traverser se retrouve au contact dau moins un argument concret ou considrable comme tel, en position sujet ou complment dobjet, ce que nous prciserons ultrieurement propos des emplois temporels et des mtaphores de la pense. Corrlativement, il est impossible de faire ltude des occurrences de traverser sans prendre en compte systmatiquement la notion de bornage. Par dfinition, une traverse, ou une activit en gnral, ne peut tre perue comme accomplie que si les bornes de lvnement concident avec les bornes de laction. Dans le cas prcis du verbe traverser, les dimensions de lobjet et son aspect born sont des donnes prendre ncessairement en compte pour ce genre danalyse. En inspectant la structure aspectuelle et smantique du prdicat verbal centre sur traverser, il apparat que la premire ne peut tre compltement sature quen fonction de donnes qui dpassent le simple cadre argumental du verbe. Outre que ce point de vue est admis, sinon dfendu, par un nombre toujours croissant de linguistes, nous entendons montrer comment fonctionnent tous les facteurs qui participent de la construction du sens, indpendamment les uns des autres aussi bien quinterdpendamment. Les lments (intrinsques) que nous avons isols dans le chapitre prcdent partir de lobservation des dictionnaires se trouvent complts par des informations extrinsques qui dpassent parfois le cadre de la phrase.
175

linstar de ce quon peut observer dans les modles dvelopps par Denis & Muller (2004), toutes les occurrences du verbe semblent pouvoir tre modlises au sein dun espace quatre dimensions, sans distinction formelle entre le Temps et lEspace. La saturation des traits aspectuels et smantiques voqus plus haut concourt la construction des modles la hauteur de linfluence de chaque lment du discours impact. En dernier lieu, les variations smantico-aspectuelles mises en relief par le contexte sont mises en parallle avec limportant paradigme de traductions du verbe traverser en anglais. Nous ne reviendrons pas sur les raisons du choix de ce verbe particulier pour la prsente tude. Nous pouvons toutefois prsumer avec raison que les prdicats verbaux qui sy apparentent peuvent subir la mme analyse systmatique avec les mmes effets sur le transfert interlangue. Plus largement, les verbes franais induisant du mouvement sont susceptibles dtre associs un nombre de traductions anglaises particulirement lev et ne constituant pas un paradigme ferm grce des mcanismes de cration lexicale que nous allons expliquer.

4.2 Diagrammes ontologiques des traverses partir de la base littraire 4.2.1 Prsentation
Les diagrammes que nous proposons, ainsi quune grande partie des travaux de ce chapitre, sont inspirs par les recherches que nous avons effectues en troite collaboration avec Laurent MASCHERIN [Haton & Mascherin 2005]167 ; presque rien de ce que nous prsentons dans les pages qui suivent na t lorigine le fruit dun seul cerveau. Les caractristiques essentielles des schmas venir sont que le sujet qui traverse est reprsent par une flche qui prcise le sens de la traverse ainsi que les bornes de dbut et de fin de laction. Dans certains cas, cette flche na pas de tte sil ny a pas de mouvement (dans le cas des transperces statiques en particulier). Dautre part lobjet travers est dessin sous la forme dune surface grise lorsquil sagit dun parcours, dune paisseur grise quand cest une transperce.

167

Travaux qui ont fait lobjet dune communication orale au congrs STLL05 qui sest tenu Rijeka (Croatie) en avril 2005 sur le thme Space and Time in language and literature . Article paratre, Sbastien Haton & Laurent Mascherin : A crosslanguages study about Space and Time : the French verb traverser and its equivalents in English , Zadar Publications.
176

4.2.2 Les traverses accomplies


Les traverses accomplies listes ici partagent la caractristique de laccomplissement au sens aspectuel, i.e. le sujet traversant effectue un parcours qui part de lextrieur de lobjet impact vers lautre ct de ce mme objet. 4.2.2.1 Traverse en largeur, prototype de la traverse La traverse en largeur avec valeur daccomplissement est la plus tudie dans les tudes linguistiques sur les verbes de mouvement. Dans lexemple ci-dessous, rencontr maintes fois dans FRANTEXT, on suppose que la traverse sopre dun point qui est dun ct (mais pas lintrieur) de lobjet travers et sachve de lautre ct de cet objet. En labsence de co-texte perturbateur de la traverse (interruption explicite), ce phnomne daccomplissement est constant pour les traverses en largeur.
(1) = Ils traversrent la rue TR168 : They crossed the street
Figure 12 : traverse dans la largeur

Nous pouvons noter que cette reprsentation correspond lobjet linguistique le plus prototypique en matire de description. Cest galement la seule qui admet lemploi absolu de traverser dans un co-texte peu dvelopp. Ils ont travers est immdiatement interprt comme un emploi avec lision de lobjet de type rue, route ou toute voie pouvant tre arpente dans sa largeur pour passer dun de ses bords lautre. 4.2.2.2 Traverse en longueur, emploi dviant Rencontr une seule fois, cette interprtation nest pas mentionne dans les dictionnaires et soppose aux smes de base du verbe puisquil ny a aucun moyen de reprer les bornes de la traverse autrement quen imaginant quune route a un dbut et une fin, et quelle est par consquent un objet scable dans sa longueur. Nous avons trouv cette occurrence sur Internet en cherchant des exemples de traverser pendant (une dure dtermine) .

168

TR = Traduction en anglais la plus probable


177

En loccurrence, il sagit probablement dun glissement de type mtonymique avec une ellipse involontaire : cest la route qui traverse les pays et les voyageurs la parcourent ; consquemment ces derniers traversent les pays par la route. Nous la prsentons ici car elle soppose tous les autres emplois du verbe autant quelle constitue, dans son statut danomalie linguistique, une opposition intressante la prcdente reprsentation dans la largeur . Si on respecte le sens habituel du verbe traverser, le parcours dnot par cette phrase devrait tre interprt comme une succession de zigzags dun bord lautre de la route, avec avance vers Quito , dernire ville jointe par la route ancestrale baptise le chemin de linca selon le co-texte :
(2) Ils ont travers, pendant neuf mois, vlo et pied, la route ancestrale baptise le chemin de l'inca, qui relie Santiago du Chili Quito en quateur. (http://www.figaroetudiant.com/associations_focus/20041127.ETU0009.html) TR : They biked and walked across the road "the lane of the INCA"
Figure 13 : traverse dans la longueur

4.2.2.3 Traverse angulaire La traverse se rsume dans cet exemple un passage furtif lintrieur dun espace ramen un angle. Cet exemple illustre la capacit de traverser dsigner un parcours de faible ampleur au sein dun espace vis comme traversable. Il montre galement que la traverse est une activit dnotant bien dautres choses que ce que suggre son acception prototypique. Comme la traverse dans la largeur, la traverse dite angulaire a une valeur daccomplissement puisque lespace vis est entirement parcouru dun bord lautre. La diffrence rside dans la partie de lobjet qui est traverse, laquelle partie est dailleurs prcise dans le co-texte suivant au moyen de la priphrase une partie de . Laccomplissement de la traverse est attest par lintermdiaire de la proposition coordonne puis montrent au premier tage de la caserne .
(3) Ils traversrent une partie de la cour, puis montrent au premier tage de la caserne. (CLAVEL Bernard /Le Cur des vivants/1964)

178

TR : They crossed or walked across one part of the yard and then walked/went upstairs to the first floor (from the outside to the outside by a corner)

Figure 14 : traverse angulaire

De lextrieur vers lextrieur par un coin

4.2.2.4 Traverse de part en part avec mouvement, transperce 1 La premire des transperces est dynamique. Loccurrence du verbe dcrit le mouvement du sujet qui traverse lobjet de part en part.
(4) = Le gnral Espagne reoit une balle qui traverse la cuirasse. TR : A bullet went/shot through General Espagnes breast-plate (transpiercing)
Figure 15 : transperce dynamique

Transperce dynamique

4.2.3 Traverses partielles


Par le jeu de la mallabilit du langage, un nombre important des traverses langagires ne sont pas accomplies et renvoient des parcours tronqus, cest--dire qui ne saturent pas le sme prototypique dun ct lautre de lobjet . 4.2.3.1 De lextrieur vers lintrieur Dans loccurrence suivante, Vronique ntait pas dans le terrain vague au dbut de laction. La phrase Elle ouvrit la portireet se glissa lintrieur signifie que la traverse sinterrompt lintrieur du terrain vague o sont gares les voitures. Comme pour loccurrence de transperce dynamique prcdente, cest le cotexte qui nous permet de dterminer le type de parcours effectu, prcis dans une moindre mesure par lemploi de limparfait de lindicatif.
(5) Vronique traversait le terrain vague o taient gares les voitures. Elle ouvrit la portire de notre vieille Porsche achete d'occasion
179

l'an pass, et se glissa l'intrieur. (AVENTIN Christine /Le Cur en poche/1988) TR : Vronique walked across/through the waste ground where the cars were parked (to get into a car parked inside the waste ground)

Figure 16 : traverse de lextrieur vers lintrieur

4.2.3.2 De lintrieur vers lextrieur Dans lexemple suivant, la maison est situe lintrieur du village, ce dernier tant lobjet travers. Il est probable une fois encore que la capacit du langage subir des ellipses en permanence permet docculter le fait que le sujet ne traverse que la partie du village situe entre la maison et la campagne . Cette conviction naltre pas nanmoins la ralit de loccurrence observe. Il faut noter une fois de plus limportance du co-texte, notamment ici le co-texte gauche qui prcde la phrase et dans lequel on apprend que le personnage est dans sa maison situe lintrieur du village quil va traverser.
(6) Il sort brusquement (de la maison [left co-text]169), traverse le village, et va dambuler dans la campagne o les paysans rient de lui.(CABANIS Jos /Les Jeux de la nuit/1964) TR : He is going out home, then walks over/accross/through the village to wander into the open country (from the inside to the outside of the village)
Figure 17 : traverse de lintrieur vers lextrieur

169

Mme si cela napparat pas dans cet extrait, il est bien prcis dans les phrases qui prcdent celle-ci que la maison est lintrieur du village.
180

4.2.3.3 De lintrieur vers lintrieur, parcours rectiligne Le parcours reprsent ci-dessous nest pas prcisment rectiligne mais plutt motiv par un but. Le sujet traverse pour atteindre un emplacement prdtermin. Nous admettons volontiers que le mme nonc puisse se rapporter une situation o le sujet ignore encore o va sarrter son parcours au moment o la traverse commence. Nous pouvons noter que la traverse ne commence que lorsque le sujet est lintrieur de la pice, et par consquent quelle suit lentre. Dans le co-texte, le circonstant en zigzaguant permet de dsigner un type de dplacement particulier. Dans la traduction vers langlais, il autorise la slection du verbe particule to zigzag through/across.
(7) Il traverse de biais la salle o l'on dnait, il n'atteignit qu'en zigzaguant le grand fauteuil de paille qui faisait face celui de la Comtesse, au bout de la table. (CHANDERNAGOR Franoise /L'Enfant des Lumires/ 1995) TR : He zigzagged through/across or cut across the dining room (to reach a place inside the room)
Figure 18 : traverse de lintrieur vers lintrieur avec objectif

4.2.3.4 De lintrieur vers lintrieur, parcours anarchique Cette occurrence du verbe traverser peut tre paraphrase par traversait en tous sens pour en caractriser la juste acception.
(8) Je lui en ai donn une et il est rest tranquillement appuy sur ma portire pour la fumer et me parler de son fils de huit mois qui traversait le salon quatre pattes (DJIAN Philippe /372 le matin/1985) TR : He talked me about his son who is/was going about and around into the living room on all fours (in all directions)
Figure 19 : traverse en intrieur sans objectif

Intrieur-Intrieur sans objectif, dans toutes les directions

181

4.2.4 Traverses statiques


4.2.4.1 Transperce statique Contrairement la transperce dynamique dcrite plus haut, la perce statique induit une absence de mouvement du sujet traversant. Il en rsulte que la traverse est dans ce cas un tat.
(9) Les vieux pilotes de Chine et d'Arabie regardaient ainsi s'orienter de lui-mme, au niveau du bol d'eau, l'oiseau peint et flottant sur son index de lige travers d'une aiguille aimante. ... Rien l d'inerte ni de passif. Dans cette fixit du vol qui n'est que laconisme, l'activit demeure combustion. (SAINT-JOHN PERSE/Oiseaux/1962) TR : () a magnetic needle going right through its cork pointer (de part en part) ().

Figure 20 : transperce statique

4.2.4.2 Traverse statique sans perce Le prototype de cette traverse est le pont qui traverse la rivire . Ici, il ny a pas non plus de parcours, le point A de dpart et le point B darrive sont hirarchiquement quivalents en labsence de mouvement et de direction se rapportant au sujet. Dans ce cas, la traverse a comme caractristique premire de seffectuer dun seul tenant sans direction particulire. Dans lexemple suivant, il est possible dinterprter la route comme ayant une direction, dans la mesure o le co-texte mentionne la sortie de la ville , ce qui suppose un mouvement orient. Cependant, cette orientation motive par le dbut de phrase ne rend pas compte du caractre inanim ni surtout de sa ralit intrinsque : la route traverse la rivire dans les deux sens. Cet exemple est peut-tre interprtable par ellipse : ce serait les voyageurs qui traversent en ralit. Dans cette optique, le fait que le pont traverse dans les deux sens est smantiquement domin et neutralis par lorientation du dplacement des voyageurs.

182

Pour cet exemple, nous avons choisi la reprsentation littrale de la situation en ignorant le parcours physique des personnes qui se dplacent sur la route qui traverse la rivire.
(10) la sortie de la ville, la route traverse une petite rivire sur un pont. (Cavanna Franois /Les Russkoffs/1979) TR : At the end of the town, the road crosses a small river on a bridge
Figure 21 : traverse statique en largeur

4.2.4.3 Une traverse semi-statique ou semi-dynamique ? Le cas de la rivire qui traverse un territoire implique du mouvement davantage que lexemple prcdent o une route ne gnre du mouvement que par le truchement de ceux qui lempruntent. Un cours deau coule toujours dans un certain sens, de sa source vers son embouchure, et possde en outre des bornes gnralement identifiables dans sa longueur comme dans sa largeur. Malgr cela, les cours deau suivent un mouvement immuable et constant170 et leur traverse nest pas forcment lie la direction du courant dun point de vue conceptuel. Une rivire qui traverse un pays peut trs bien tre considre comme une tendue deau longiligne dont on ignore le dplacement du flot pour ne considrer que sa ralit gographique.
(11) (...) la porte entrouverte de l'un des bungalows. Le chantier : une rivire le traverse, un pont inachev ; au loin, un lac. Les appels de la garde : bruits de langue, de gorge, choc de fer sur du fer, de fer sur du bois, petit cris, hoquets () (KOLTS Bernard-Marie /Combat de ngre et de chiens suivi des Carnets/1983) TR : The building site: crossed by a river, an unfinished bridge; ()
Figure 22 : traverse semi-dynamique

170

Si lon excepte les cas de dtournement, de tarissement ou de barrage par lhumain ou par des circonstances naturelles (scheresse et crues par exemple).
183

4.2.5 Traverses ininterprtables dans lespace de lobjet


4.2.5.1 Traverses temporelles A moins de considrer le temps comme une surface, nous ne voulons pas pour linstant intgrer les traverses temporelles dans notre srie de diagrammes ontologiques, lesquels ne concernent donc que les traverses spatiales, dynamiques et statiques. Toutefois, nous proposons en section 3.4 une reprsentation des emplois temporels dans des modles quivalents aux emplois spatiaux. En loccurrence, il sagit dune projection de tous les emplois du verbe dans un espace quatre dimensions, une seule dimension tant ncessaire pour reprsenter la plupart des emplois temporels. Nous verrons nanmoins que certains de ces derniers peuvent tre conceptuellement associs des traverses spatiales, lorsque lobjet vis nest plus explicitement un intervalle temporel mais un vnement. 4.2.5.2 Mtaphores de la pense Contrairement aux emplois temporels, qui impliquent des sujets concrets dans une priode de temps donne, les mtaphores de la pense mettent en jeu des facteurs abstraits. Les sujets sont des ides, des penses ou toute autre manifestation de lesprit quil nest pas possible de matrialiser (sauf sous forme de dessin ou de graphie pour les images mentales ou les ides verbalises) ; lobjet est systmatiquement le cerveau ou un de ses avatars langagiers (esprit, pense, etc.). De ce fait, aucun de nos diagrammes nest susceptible de reprsenter fidlement la ralit de ce type doccurrences.

4.3 Mouvement et bornage dans les traverses 4.3.1 Pour commencer avec laspect
Commenons par tablir les distinctions de base : en physique fondamentale, le temps est unidimensionnel, tandis que lespace est tridimensionnel. Cette nuance essentielle va motiver certaines traductions de traverser en anglais, dautant que les occurrences de traverser sont soumises la double influence du Temps et de LEspace dans la saturation de ses traits aspectuels Au-del de cette opposition, les dimensions temporelles et spatiales impliquent deux types de variables complmentaires qui sont le mouvement et le bornage. Comme le soulignent Muller & Sarda (1998:133), le verbe traverser peut tre paraphras par passer dun ct lautre ct de x, et dans ce cadre il implique donc une dimension directionnelle et une dimension de localisation. Par ailleurs, cette paraphrase en ltat prsuppose un accomplissement de la traverse en tant que
184

franchissement dune ligne virtuelle (ou dun espace) qui spare un point A dun point B, tous deux situs de part et dautre de lobjet travers. Le sens aspectuel du verbe traverser na jamais t classifi dans le cadre dune typologie des procs. Lorsquil apparat comme exemple prototypique dune classe aspectuelle, il y entre toujours sous la forme prdicative traverser la rue ou en emploi absolu avec la mme acception strotypique (Vendler 1967171 ; Rcanati & Rcanati 1999) et dans ce cadre, il est considr comme un verbe daccomplissement. Au niveau lexical, Victorri (1997), Sarda et Muller (1998:144, figure 6) le considrent galement comme un verbe tlique et transitionnel, donc daccomplissement, en considrant que le sujet qui traverse dpasse lobjet travers. Ces visions sont videmment conditionnes par une tude globale des verbes de mouvement ou par une volont de btir une typologie gnrale fonde sur lusage habituel ou les traits gnriques plutt que sur le sable de lanalyse systmatique de chaque verbe selon ses emplois potentiels. En contexte, chaque verbe dploie son ventail demplois possibles, voire impossibles du point de vue normatif (cf. Limpossible dans la langue, Rousseau 2000). De ce point de vue, nous ne pouvons pas ignorer les emplois anormaux ou dviants , volontairement ignors ou sous-voques dans les tudes globales. Le point de vue le plus ouvertement hostile la classification des emplois inhabituels est celui de Vendler dans son essai de 1967 sur la typologie des classes de procs. Il y prsente entre autres une occurrence du verbe to cross quil appelle oddity, cest--dire bizarrerie ou anomalie en franais :
For those who like oddities: it took the battalion twenty minutes to cross the border; They are crossing the border. Such are the borderline cases I mean to ignore at this stage

(Vendler, 1967) La consultation des donnes lexicographiques nous permet donc de dgager quatre classes smantiques pour ce verbe, lesquelles renvoient de multiples valeurs aspectuelles. Ces diffrentes dimensions aspectuelles et spatiales sont lies intrinsquement la structure prdicative (voir ce qui se passe dans le TLF par exemple) : parcours spatial (dynamique, statif ou en emploi absolu) ; transperce (dynamique ou statif) ; parcours temporel (statif au sens spatial et dynamique au sens temporel) ;
171

Vendler ne prsente pas le prdicat verbal traverser la rue mais son quivalent en anglais to cross the street. lissue de la dmonstration, ses conclusions sont quivalentes.
185

mtaphore de la pense (emploi figur associ au sens de transperce). Toutefois, les arguments du verbe ne suffisent pas dterminer de faon systmatique comment ces traits aspectuels sont effectivement saturs. Dans les prochains paragraphes, nous montrerons comment le prdicat au sens large et le cotexte jouent un rle dans la reconnaissance des traits aspectuels qui ne dpendent pas du contexte non langagier. En premier lieu, nous distinguerons les arguments en mouvement, ou soumis la traverse, des objets intrinsquement borns qui la subissent.

4.3.2 Ce qui bouge


4.3.2.1 Lobjet en mouvement Nous admettons que lobjet en mouvement est non pertinent dans lanalyse. Par l il faut entendre quil nexiste pas notre connaissance doccurrence de traverser pour lequel lobjet-site est en mouvement avec un effet pertinent sur la saturation des traits aspectuels de lnonc dans son ensemble. Cela nexclut pas la possibilit dun nonc tel que le suivant que nous avons construit : (10) Nous traversions avec peine le pont du bateau (NDLR : /bateau/
qui traversait lui-mme locan)

Le circonstant avec peine est un indicateur de la difficult quil y a se dplacer sur un objet en mouvement tel que le pont dun bateau. Faute de donnes corpusculaires en nombre suffisant, nous nintgrerons ce type doccurrence quavec prudence et parcimonie. 4.3.2.2 Le sujet en mouvement De fait, puisque lobjet en mouvement nest pas observable, la pertinence du mouvement est reporte sur le sujet et ventuellement sur lobservateur puisque cest ce dernier qui constate le mouvement et le transmet en tant que locuteur. Nous verrons que, contrairement Reichenbach (1980), nous nintgrons pas lobservateur dans la modlisation du prdicat, avant tout parce que lobservation subjective est llment le plus difficile isoler et caractriser dans un texte crit par quelquun dautre que soi (cf. la question de la polysmie absolue172).

172

Notion que nous prsentons au Chapitre I.


186

Afin de ne pas mlanger toutes les acceptions du verbe au sein dun mme modle de fonctionnement, il est ncessaire de bien faire la diffrence entre les emplois de traverser : Pour les parcours spatiaux avec dplacement dans un espace ou sur une surface, le mouvement du sujet est manifeste. Il ny a pas de parcours spatial sans mouvement du sujet smantique, formes passives comprises. Les transperces se partagent en deux classes, lune inclut les occurrences o la perce sopre avec un sujet en mouvement qui passe dun ct lautre de la cible , lautre contient les emplois statifs pour lesquels la traverse est un fait, une observation dun tat dans une interaction immobile mais pas immuable. Une transition entre les deux est possible si lobjet qui transperce est en mouvement avant le contact avec la cible puis reste fich dedans. Les emplois temporels seront discuts ultrieurement. Dans un premier temps, nous considrons quil ne sagit plus dun sens mtaphorique driv du spatial, mais bien dun sens propre lexicalis dans la langue (cf. Todorov, 1967). Or, la structure argumentale de traverser suppose lexistence dun sujet qui effectue rellement une traverse (mme statiquement) sur un objet qui nest pas cens bouger.
Les emplois que nous considrons comme rellement mtaphoriques

ne comportent les notions de mouvement et de bornage que dun point de vue conceptuel, et il ne sagit dailleurs l que de notre propre vision de ces acceptions. Les mtaphores stricto sensu se heurtent lanalyse n-dimensionnelle que nous proposons car il nest pas possible de reprer le mouvement rel du sujet ni les bornes de lobjet en tant quespace travers. 4.3.2.3 Prise en compte globale du mouvement dans lanalyse Bien qutant un des traits smantiques les plus saillants dans la structure prdicative prototypique de traverser, le mouvement est manifestement un trait qui ne concerne pas lensemble des acceptions du verbe. Parmi les nombreux traits que nous essayons de mettre en exergue, celui-ci ne concerne rellement quune frange minoritaire des acceptions nomenclatures prcdemment. Toutefois, la mise en perspective homogne de laction de traverser en contexte par des modles graphiques nest pas remettre en cause, puisque le mouvement nest quun des lments prvus par nos modles sans tre la condition de leur constitution.
187

4.3.3 Ce qui est born


4.3.3.1 Les bornes du sujet smantique Comme tout objet identifiable, le sujet est born en soi mais son bornage nest pas initialement pertinent dans lanalyse aspectuelle du prdicat. En effet, dans les emplois les plus frquents du verbe traverser, le sujet est ramen la traverse ellemme. Cest donc le parcours et non la chose traversant qui est pris en compte pour la reconnaissance de la structure aspectuelle finale du prdicat. Certains emplois du verbe ncessitent cependant la juste reconnaissance des bornes du sujet : cest le cas notamment des transperces de part en part qui supposent que les extrmits du sujet traversant sont de part et dautre de lobjet travers. Ceci pose par ailleurs un problme de modlisation, comme nous allons le voir dans le sous-chapitre correspondant. 4.3.3.2 Les bornes de lobjet smantique A linverse du mouvement ventuel, lobjet porte les marques de bornage saillantes dans le procs. En effet, en reprenant la paraphrase de Muller & Sarda, nous admettons dans un premier temps que traverser est un verbe dit tlique quand il y a passage dun ct lautre de X. Il est notable quaucune mention de lobjet traversant nest faite dans cette paraphrase, alors que lobjet travers est intrinsquement born dans la prdication puisque le passage dun ct lautre implique la prsence dau moins deux cts (cf. ontologie et modles), et subsquemment de bornes spatiales. De mme, il nest pas difficile dtendre, disons plutt damnager cette paraphrase pour dautres emplois moins accomplis : passage dun point A un point B avec focalisation prdicative sur lobjet Y, sans prsomption dinclusion ou dexclusion des points A et B lespace circonscrit par Y. De ce point de vue, Y prsente des bornes identifiables et autorise la mise en perspective du type de traverse effectu en fonction de cette fameuse inclusion ou non de A et B. Cest partir de ce phnomne dinclusion / exclusion que les marques aspectuelles de la traverse sont identifiables. Il en ressort que le bornage saillant est une valeur propre lobjet dans ltude de la structure aspectuelle du prdicat. 4.3.3.3 Les limites de laction et de lvnement Les bornes de laction ne sont pas forcment dpendantes du mouvement et elles ne sont pas directement corrles aux bornes de lobjet travers. Dans notre nomenclature, il sagit des bornes spatiales de lvnement lintrieur et au-del de lespace travers. En dautres termes, quel que soit le type de traverse dont il sagit et
188

quelle que soit sa forme, les limites de laction correspondent aux bornes de dbut et de fin de la traverse, i.e. lintersection du bornage spatial et du bornage temporel. Nous rappelons que lobjet est toujours dlimit en ce qui concerne les emplois spatiaux de traverser. Par ailleurs au niveau aspectuel, lvnement, cest--dire le parcours effectu, est toujours contraint. En dautres termes, une traverse possde des bornes temporelles qui correspondent la dlimitation de lintervalle durant laquelle laction se droule. Les limites de lvnement conditionnent les limites de laction prcdemment dcrites : laction commence linstant t0 qui est la borne initiale de lvnement et sachve linstant t1 qui est la borne finale de lvnement. Ceci implique une lecture de la nature de laction dnote par telle ou telle traverse en fonction de sa dure. Pour bien distinguer laction de lvnement, nous pouvons dire que la premire rpond la question o le parcours commence et o sarrte-t-il ? en montrant la relation entre la ralit spatiale du parcours (incluant la spatialit de lobjet qui traverse) et celle de lespace parcouru ; quant au second, il rpond linterrogation suivante : Quand la traverse commence et sachve-t-elle ? , ce qui fait quil a trait la structure temporelle de laction. Les bornes de laction et de lvnement sont intriques dans la ralit du monde et du langage et nous le mettrons en avant dans nos modles. 4.3.3.4 Rsum du bornage Les dimensions aspectuelles du changement et de laboutissement (tlicit) ne correspondent pas toujours la dimension spatiale de lobjet travers (nous reviendrons sur ces questions dans la partie suivante). Comme nous pouvons le remarquer partir des reprsentations ontologiques de traverser, il est possible de parler de traverse ds lors quil y a parcours au sein dun objet ayant la particularit de possder des bornes externes identifiables. Nous constatons rapidement que la paraphrase de Sarda est partiellement vraie et non gnralisable, puisque parmi tous nos diagrammes ontologiques seuls deux reprsentent explicitement le passage dun ct lautre ct de x. Ainsi, si toute traverse dynamique implique en principe le passage dun point A vers un point B, ce mouvement nest pas ncessairement structur par lespace travers et ses bornes173.

173

Cela revient dire quune traverse dynamique est toujours un dplacement dun point vers un autre, mais que la connaissance des bornes de lespace travers nest pas ncessairement suffisant pour la caractriser.
189

4.3.4 La dimension aspectuelle des situations


4.3.4.1 Quelques dfinitions La dimension aspectuelle des situations peut tre dfinie comme laction intrinsque au prdicat, cest--dire en dehors de la reprsentation du temps en tant quappartenant aux ensembles pass-prsent-futur et antrieur-simultan-postrieur. Au niveau smantique, plusieurs caractristiques permettent de dfinir quel est le type daction exprim. Cette dimension aspectuelle est partiellement dpendante de linterprtation du co-texte extra-prdicatif, en particulier pour les occurrences dun verbe comme traverser, pour lequel la recherche des bornes de laction et de lvnement sont tributaires des actions et vnements antrieurs et postrieurs, savoir les actions qui prcdent et qui permettent de dterminer le point de dpart, et les actions qui suivent, lesquelles donnent lclairage sur le point darrive. Partant de ce postulat, il nous faut effectuer deux distinctions : une distinction entre les proprits aspectuelles propres au lexme verbal et les proprits aspectuelles prdicatives et extra-prdicatives ;
et une autre entre les classes aspectuelles et les traits aspectuels.

4.3.4.2 Sens aspectuel du verbe : proprits intrinsques et potentiel Tout verbe, en tant qulment central de lexpression dun procs, possde un sens aspectuel, soit de faon prototypique, soit en terme de potentialit. Le contexte quil soit prdicatif ou phrastique peut entraner une modification du sens aspectuel primaire ou simple du verbe. Cette modification de la valeur aspectuelle du verbe en fonction du contexte peut-tre analyse en terme de combinatoires de valeurs aspectuelles ou selon une analyse prdicative ou phrastique. Ce qui nous intresse tout particulirement dans notre analyse globale du verbe traverser est le dcalage perceptible entre laspect prvisible port par le verbe et sa ralisation en contexte. En tout tat de cause, il apparat que les verbes sont lexicalement marqus comme porteurs de traits spcifiques174 mais que ces traits sont soit confirms, soit modifis soit compltement neutraliss par le contexte nonciatif. Do il ressort quune thorie prliminaire visant dresser une typologie lexicale hors contexte peut tre facilement remise en question dans le cadre dune analyse des prdicats en contexte. Ceci conforte notre hypothse que les traits aspectuels ne sont pas seulement inhrents au lexme verbal mais dpendent essentiellement du cadre nonciatif au sens
174

Ce que confirment les classifications aspectuelles des auteurs que nous avons consults.
190

large. De par sa forte polysmie, traverser pose initialement un problme de typologie par le prototype telle que nous le retrouvons dans les tudes existantes. Cette vision des choses nexclut pas, videmment, que le lexme verbal conserve son propre potentiel aspectuel activable en dehors de tout contexte langagier. 4.3.4.3 Typologie aspectuelle, classes et traits distinctifs Comme nous lannoncions au paragraphe prcdent, la structure temporelle du verbe peut-tre reprsente sous la forme dintervalles et de bornage. Afin de limiter dans un premier temps la description de la dimension aspectuelle de traverser, et par extension de tout autre verbe, nous choisissons de nous appuyer sur les quatre classes aspectuelles de Vendler, stablissant partir des proprits smantiques des verbes et prdicats, et matrialiss sous la forme de traits smantiques : verbes daccomplissement ; verbes dachvement ; verbes dtat ; verbes dactivit. Dans notre tude, nous distinguons systmatiquement les traits smantiques inhrents au sens aspectuel du lexme verbal des traits smantiques extrinsques. Parmi tous les traits smantiques et temporels, quatre suffisent pour distinguer le sens aspectuel des verbes au sein de cette typologie quatre classes. Ces traits sont soit activs (+) soit non (-) : changement : le procs implique ou non un changement entre sa phase antrieure et sa phase ultrieure ; momentan : le procs est vu sans dure ; tlique : le procs a besoin datteindre un point culminant pour tre dit ralis ; dynamique : le procs est conu comme se droulant dans le temps.

191

Hors contexte dnonciation, ces traits nous permettent dorganiser les types de procs comme suit :
Figure 23 : typologie aspectuelle

Changement Achvement (partir175, trouver,) Accomplissement (traverser, ) Activit (courir, danser,) tat (dsirer, aimer,) + + -

Momentan Tlique Dynamique Pas dintervalle + + temporel donc pas de tlicit + + + -

Les verbes associs chaque classe sont choisis en fonction de leur emploi le plus courant. Lun de nos objectifs majeurs demeure de montrer quil nest pas pertinent pour notre tude doprer une telle classification pralable verbe par verbe car le co-texte et la situation dnonciation modifient profondment les valeurs aspectuelles attendues , motivant une rorganisation des classes aspectuelles emploi par emploi. De plus, les traductions dun verbe comme traverser sont tributaires de la saturation des aspectmes176. La limitation des traits aux quatre prcits nous semble obligatoire pour permettre une distinction claire des lments exprimant laspect et de leur combinatoire. 4.3.4.4 Remise en cause de la typologie des verbes, bornage et tlicit Vet (1980)177 et Franois (1989)178 font intervenir un trait prdicatif qui est lagentivit et qui concerne lintervention dun agent (agent anim) au niveau du procs. Nous pouvons nous demander si la distinction entre procs agentif et nonagentif permet de construire un nouveau type de procs ou bien si elle ne fait que rendre compte dun changement de type de procs. Car, pour reprendre un argument de Karolak (2003), en soi, lagent nexprime pas du temps, cest lagent en mouvement qui exprime du temps.
Les verbes prsents ne sont en aucun cas circonscrits une seule classe aspectuelle. Il sagit seulement de leurs proprits prototypiques. 176 Laspectme est la plus petite unit porteuse daspect. 177 Vet C., 1980. Temps, aspects et adverbes de temps en franais contemporain, Genve : Droz. 178 Franois J., 1988. Changement, causation, action. Trois catgories smantiques fondamentales du lexique verbal franais-allemand. Librairie Droz.
192
175

A nos yeux, la problmatique la plus intressante pour analyser ce verbe consiste dans lopposition entre le bornage et la tlicit. Pour ce faire, nous nous appuyons sur lanalyse de Kozlowska (1998) qui considre que la tlicit est inhrente au lexme verbal et que le bornage est extrinsque, cest--dire dpendant des valeurs contextuelles. Pour Kozlowska, la notion de borne est distinguer de la notion de tlicit :
La tlicit est alors une proprit inhrente (intrinsque) dune ventualit : une ventualit est par dfaut tlique ou non tlique. Par contre, le bornage nest pas une proprit inhrente (cest une proprit extrinsque). Kozlowska (1998 : 220)

En reprenant cette distinction pour notre compte, nous montrerons comment le co-texte aide fixer les bornes de lvnement, mais aussi comment la reconnaissance de ces bornes mne la dtermination de la prsence ou non de tlicit lie au procs en contexte. Cest ce que nous voquions quelques pages plus tt propos de lvnement : la recherche des bornes de laction et de lvnement sont tributaires des actions et vnements antrieurs et postrieurs . La difficult est que ces deux types de bornages peuvent tre rassembls sous la mme dfinition pose par Martin : Un procs est born sil porte en lui-mme une limite en de de laquelle il ne peut tre dit ralis et au-del de laquelle il ne peut tre que recommenc et non pas prolong. (Martin 1988 : 5) Nous mettons lhypothse que pour tre tlique le verbe traverser doit remplir deux conditions : Tous ses emplois doivent impliquer une borne finale, ce qui nest pas forcment le cas en contexte. Si un emploi ne possde pas ce trait il faut dmontrer que le contexte empche la ralisation de cette borne, qui reste vise. A contrario, si nous pensons que le verbe est non-tlique, il faut montrer que dans toutes ses occurrences, cest le contexte discursif qui va poser la borne finale. Autrement dit, le verbe traverser nest peut-tre pas intrinsquement tlique, ce qui induit que cest le cadre discursif tout entier qui contient et dtermine des fragments tliques et dautres qui ne le sont pas.

193

4.3.4.5 Ce qui dtermine le smantisme du verbe Une des questions principales est de savoir si traverser est dtermin par lobjet qui est travers, par le parcours effectu par lobjet travers ou bien par le contexte situationnel encadrant le procs de la traverse. Lobservation des emplois du verbe nous montre que le sens de traverser en contexte est fonction de tous les lments prcits, mais que la saturation de ses traits aspectuels dpend du co-texte, voire de labsence de co-texte. En effet, les exemples construits dont nous prsenterons quelques spcimens dans la partie modlisation donnent facilement lieu plusieurs interprtations, chacune dentre elles suggrant un ensemble de traits aspectuels distincts des autres. Il est notable que labsence de co-texte induit des proprits particulires pour le verbe traverser comme pour nimporte quel autre verbe. En loccurrence, un nonc sans contexte langagier supplmentaire tel que nous avons travers la place ne peut sinterprter que comme un acte accompli sous peine dtre ininterprtable, faute dinformations. Cest certainement pour cette raison que traverser entre dans les typologies en tant que verbe tlique.
179

4.3.5 Valeurs aspectuelles de traverser et bornage


4.3.5.1 Prsentation des tests de recherche des bornes Pour la recherche des bornes, nous aurons dabord recours deux tests standard : le test de compatibilit avec en/pendant suivi dun syntagme exprimant une dure, o en valide les prdicats tliques et pendant valide les prdicats non-tliques. Si les deux tests sont possibles (voir Renaud 2001), il faut tendre le test au contexte largi ; le test de limplication180 afin de dterminer si le procs est compris entre deux changements (Vet 1980 : 61). Dans lexemple du verbe traverser, le changement correspond un changement spatial, traverser

179

Nous considrons travers le mot objet les individus anims / non-anims et les objets anims / non-anims. Le terme est prendre ici au sens syntaxique. 180 Le test de limplication selon Vet fonctionne comme la recherche dun changement entre un tat antrieur au prdicat et un tat ultrieur. Autrement dit, il y a tlicit si avant P(x) il ny avait pas x et si aprs il y a x. Dans le cas du verbe traverser formalis par Traverser(x) o x est lespace travers, le test dimplication est valide si avant lemploi du verbe il ny avait pas traverse de x et si aprs la traverse est accomplie. Or, on peut traverser quelque chose sans quil y ait ncessairement accomplissement de la traverse toute entire (simple activit ou traverse partielle).
194

quelque chose pour revenir au point de dpart nimpliquant pas de changement. La combinaison des deux tests nous permet de dterminer la classe aspectuelle de chaque emploi du verbe : Les verbes dtat se caractrisent par lchec aux deux tests, ils nont pas de dure et nimpliquent pas de changement.
Les verbes dachvement ne rpondent pas au test temporel par

en/pendant car ils induisent une absence de dure. Toutefois, le changement est ncessaire pour que le climax propre lachvement soit atteint.
Les verbes dactivit et daccomplissement impliquent tous les deux

une dure, une reconnaissance des bornes de lvnement. Les deux classes se distinguent par le test de changement. Une activit se caractrise par labsence de changement entre ses bornes antrieures et postrieures, tandis que laccomplissement est ncessairement associ un changement. 4.3.5.2 Les emplois statifs : recherche des bornes Reprenons lextrait des Oiseaux de Saint-John Perse :
Les vieux pilotes de Chine et d'Arabie regardaient ainsi s'orienter de luimme, au niveau du bol d'eau, l'oiseau peint et flottant sur son index de lige travers d'une aiguille aimante. ... Rien l d'inerte ni de passif. Dans cette fixit du vol qui n'est que laconisme, l'activit demeure combustion. SAINT-JOHN PERSE /Oiseaux/1962

Test temporel : * Laiguille aimante traverse loiseau peint et flottant en une heure. ? Laiguille aimante traverse loiseau peint et flottant pendant une heure.

195

partir de ce test, nous pouvons dire que les emplois statifs de traverser ont plusieurs caractristiques : Les tests de limplication et du changement ne fonctionnent pas, ni le test en/pendant. Lagent est non-anim, non agentif. Ainsi, le trait de Vet et Franois semble tre pertinent ici, dans le sens o il permet de guider linterprtation du sens aspectuel du verbe. Toutefois, il sagit avant tout dune consquence de lacception particulire du verbe, la transperce statique ne seffectue pas normalement, et par dfinition, avec un sujet agentif anim. Parmi les emplois non-agentifs, il existe une autre catgorie plus ambigu, il sagit du temps qui fait avancer lvnement sans dplacement apparent de lagent. Nous dtaillerons cette catgorie dans la partie constrastive de ce chapitre. 4.3.5.3 Les emplois ponctuels : recherche des bornes Les emplois dits ponctuels se retrouvent principalement dans la valeur mtaphorique des emplois de traverser. En effet, lespace travers tant indlimit et indlimitable, seul le test du changement permet de dfinir ses proprits smantiques et il ne semble y avoir aucune phase prparatoire. De plus, les adverbes juxtaposs au prdicat sont des indices de limmdiatet de la situation. Le changement est clair puisque ces verbes impliquent quavant la traverse lide ntait pas l est quaprs elle est l.
Il y a des moments, oui, o vous me faites peur... et votre type, l, l' homme la fleur, a ne vous a jamais travers le crne qu' il avait peur de vous, lui aussi? Rivoyre Christine de /Les Sultans/1964 C'est alors que son esprit fut brusquement travers par une ide, une image, qui ne l'avait pas encore effleure, une phrase cent fois entendue - il y avait tant de gibets ! -, une plaisanterie affreuse sur le sexe des pendus () Chandernagor Franoise /L'Enfant des Lumires/1995 Et c'est ce jour-l que, pour la premire fois, cette pense exaltante me traversa l'esprit : " Et si l'on pouvait exprimer cette langue par crit ?" Makine Andre /Le Testament franais/1995

196

Les emplois de traverser pouvant tre gloss par transpercer peuvent galement tre des verbes dachvement et peuvent avoir le double sens achvement / statif.
Le malheureux mannequin qui traversa une fentre du Montana pour s'craser sur le pav n'instaura jamais une cole du dsarroi. Blondin Antoine /Ma vie entre les lignes/1982

4.3.5.4 Les emplois dynamiques : recherche des bornes Les emplois dynamiques de traverser possdent une caractristique essentielle, le sujet qui traverse doit tre un anim, objet ou individu. Plus exactement, lagent doit tre en mouvement, ce qui ne le contraint pas ncessairement se mouvoir de son plein gr, et consquemment nimplique pas quil soit intrinsquement anim. Observons deux exemples construits du verbe traverser et lapplication des tests de Vet :
(1) X traverse la route. (2) X traverse un pays. (1a) X traverse la route en quelques secondes (implique que x est dun ct de la rue et prsuppose que x tait de lautre ct de la rue). (1b) X traverse la route pendant quelques secondes (prsuppose ventuellement que x tait dun ct de la rue et nimplique pas que x a ncessairement travers entirement). (2a) X traverse un pays en quelques jours (implique que x est dun ct du pays et prsuppose que x tait de lautre ct du pays). (2b) X traverse un pays pendant quelques jours (pas dimplication, pas de prsupposition).

Hors contexte, le test en / pendant ne fonctionne pas clairement ; traverser peut tre peru comme un verbe daccomplissement ou dactivit, seul le contexte largi permet de rendre compte du bornage, mme sil sagit ici dun exemple dviant dont nous avons dj discut dans la prsentation des diagrammes ontologiques (3) : (3) Ils ont travers, pendant neuf mois, vlo et pied, la route ancestrale baptise le chemin de l'inca, qui relie Santiago du Chili Quito en quateur. (http://www.figaroetudiant.com/associations_focus/20041127.ETU0009.html)
TR : They biked and walked across the road "the lane of the INCA"

Nous noterons que les deux sens de traverser avec en et pendant demandent deux orientations spatiales diffrentes, celles-ci correspondant la distinction entre la
197

traverse en largeur - qui est le prototype de la traverse - et les autres traverses moins linaires. En effet, (1a) se situe prfrentiellement dans un espace unidimensionnel et (1b) dans un espace bidimensionnel. Il en est de mme pour (2a) et (2b). Les lectures n-dimensionnelles de lespace ne sont pas fixes lavance, elles dpendent du contexte nonciatif comme nous lavons vu avec les exemples ci-dessus. Mais lobjet travers implique sans doute intuitivement un sens prototypique qui est (1a) pour lexemple 1 et (2a) pour lexemple 2. Ainsi dans (1a), la lecture (prototypique) est laccomplissement ; nous pouvons considrer que la valeur intrinsquement tlique du prdicat est fonction du franchissement des bornes externes de lobjet. Quant (2b) la lecture (toujours prototypique) est lactivit, traverser implique un parcours dans lobjet travers. En conclusion ces observations gnrales, nous dgageons deux emplois dynamiques identifiables : celui pour lequel lintervalle temporel dpend de lintervalle spatial vu comme unidimensionnel, dans ce cas lvnement pour tre dit ralis doit absolument atteindre les bornes externes de la cible (lectures privilgies : traverser une route, rue, rivire) ; ou bien, lintervalle temporel fixe des limites au sein desquelles se situe la traverse (maison, pays, village, ville, etc.), le verbe traverser dans ce cas est limit par des bornes internes de la cible. La traverse na pas besoin datteindre un point culminant pour tre effectue. Lagent qui traverse est un anim. Y a-t-il une distinction au niveau du contrle de lagent sur le procs, ce qui reviendrait distinguer objet dindividu ? Lobjet travers doit tre spatialement tendu et limit ; lagent doit dpasser les limites de cet espace. A travers le corpus nous pouvons remarquer que le trait de changement nest pas limit lespace travers, on peut traverser une ville depuis une maison se situant dans la ville, il y aura changement puisque X va dun point un autre et parce que les points de dpart et darrive ne sont pas confondus, sauf si le co-texte le mentionne (traverser pour revenir au point de dpart). 4.3.5.5 Quelle classe pour traverser ? Daprs les auteurs et en vertu des caractristiques de ses emplois absolus, le verbe traverser en tant que tel est caractristique de la classe des verbes daccomplissement, mais uniquement dans un sens prototypique o son emploi implique un changement despace et latteinte dun point culminant. En effet, en contexte, la structure prdicative du verbe traverser est dabord soumise deux variables X et Y, tel que X traverse Y. La valeur de ces deux variables influe considrablement sur le degr de tlicit du verbe et parfois mme sur les autres variables. ct de cela, le contexte largi a un rle prpondrant dans les valeurs aspectuelles et le bornage de ce verbe.
198

Le bornage temporel intrinsque correspond au bornage spatial uniquement dans le cas o lobjet serait considr comme une frontire entre deux lieux, sinon seul le contexte et donc le bornage extrinsque permet de dterminer les bornes temporelles initiales et finales de la traverse. En fait, nous pouvons supposer que cet objet est vu comme unidimensionnel, comme le Temps. Les dimensions spatio-temporelles du verbe traverser sont profondment intriques linstar de la relation entre laction et lvnement, et nous pouvons conclure une double valeur aspectuelle de ce verbe : accomplissement et activit, les dimensions aspectuelles dachvement et dtat tant des valeurs secondaires mais pas du tout impossibles.

4.4 Modlisation 4.4.1 Prparation des modles


La prsente partie sera consacre lexplicitation de modles qui font ressortir la plupart des traits aspectuels, y compris et avant tout le mouvement et le bornage, pour toutes les occurrences de traverser. Nous avons cr ces modles pour lanalyse de donnes issues dune base littraire, en loccurrence FRANTEXT. Toutefois, la modlisation que nous allons dcrire permet de reprsenter toutes les occurrences de traverser, quelles soient des exemples construits ou non, car lun de nos objectifs principaux est de dmontrer que traverser est un verbe dont les emplois peuvent entrer dans les quatre classes de Vendler dont il a t question prcdemment : accomplissement, activit, tat et achvement, et ce selon les variables co-textuelles qui entourent le verbe. Tout comme Einstein (1986, traduction) et Muller & Denis (2004), nous admettons quil ny a pas de distinction relle entre Temps et Espace et quils peuvent tre runis au mme niveau dun modle quadridimensionnel. Dun point de vue physico-mathmatique rapport au langage naturel, nous pensons quil existe un Univers quatre dimensions insparables, et que le Temps en tant quentit unidimensionnelle nest pas sparer de lEspace tridimensionnel. La distinction essentielle que nous faisons se situe dans la reprsentation graphique sur deux axes : laxe temporel et les trois dimensions spatiales aplaties sur laxe spatial. Grce ltude systmatique du corpus, nous avons imagin une reprsentation orthogonale des sens de traverser. En effet, la plupart des emplois du verbe traverser sinscrivent dans des cadres spatiaux et temporels identifiables ; les recherches des bornes temporelles et spatiales seffectuent indiffremment dans le co-texte et sont intriques, comme nous lavons dj dit. En fait, les emplois spatiaux et temporels du verbe semblent conceptuellement proches, bien que leurs paradigmes de traductions respectifs ne soient pas toujours comparables. Ainsi, nous partons de lhypothse que Temps et Espace doivent
199

appartenir un mme champ, et consquemment apparatre dans un mme repre mathmatique orthonorm, lequel doit prserver la nature dimensionnelle de chacun. En outre, toutes les occurrences dcrites par le truchement de ce modle le seront systmatiquement en fonction du temps et de lespace, mme pour les occurrences qui nen ncessitent pas la reprsentation.

4.4.2 Caractristiques des modles


4.4.2.1 Forme mathmatique Pour des raisons essentiellement pratiques de lisibilit, nos modles ne comportent donc que deux axes, lun spatial et lautre temporel. Les trois dimensions spatiales sont projetes sur un mme axe, nonobstant la possibilit de transformer laxe spatial en une succession de surfaces ou de volumes selon les cas. Notre modlisation de traverser se fait dans un repre orthonorm. Ses caractristiques sont les suivantes : Le repre orthonorm est en apparence bidimensionnel (2D), il manque donc deux dimensions spatiales. Nous ne perdons pas de vue que lobjet travers peut tre peru comme une ligne (1D), une surface (2D) ou un volume (3D), et que tous les trois existent tout instant du temps, laquelle est la quatrime dimension. Dun autre ct, nous avons galement tabli que la dtermination des dimensions apparentes du sujet traversant nest pas pertinente dans la recherche des traits aspectuels, et donc sans effet sur notre modle. Par consquent, beaucoup demplois du verbe ncessiteront une reprsentation de lobjet en quatre dimensions, mais cela nest pas vraiment un problme, comme nous allons le montrer, tant que le sujet ne ncessite pas dtre reprsent lui aussi en perspective. Le temps est en abscisse et lespace en ordonne pour tous nos modles. Nous lavons dj dit, le contexte (prsum ou non) pose les bornes et notre reprsentation en ncessite six : 2 bornes spatiales internes pour fixer les limites de lobjet (Bo1 et Bo2), deux bornes spatiales externes pour fixer les limites de la traverse par rapport lobjet (Bt1 et Bt2) et deux bornes temporelles du dbut de lvnement jusqu son terme (E1 et E2). Comme vous pourrez le voir sur nos modles, le temps est partag en lignes verticales noires, chaque ligne reprsentant un instant ou plus
200

prcisment la position du sujet et de lobjet dans lespace un instant du temps. Nous navons pas creus plus avant la notion dinstant du temps car cela nous amnerait considrer que tout laps de temps contient un nombre infini dinstants, et cela rendrait immdiatement caduc notre mode de reprsentation. Aussi, nous nous contenterons dadmettre ce prcepte dinfinitude tout en adoptant une vision plus souple dans nos dessins. Dans la mesure du possible et du lisible, lobjet travers est figur par une ligne (1D, typiquement une rivire ou une frontire), une surface (2D, comme un pays plat) ou un volume (3D, pas de prototype) rpt(s) chaque instant du temps.
Le sujet qui traverse est prsent comme une succession de points

figurant la position du sujet par rapport lobjet suivant lavance du temps. Afin de prsenter des modles homognes pour tous les emplois dcrits, cette succession de points ne reprsente que le point dimpact ou de contact du sujet traversant sur lobjet travers. Cest pourquoi certains modles ne figurent pas exactement la nature de la traverse ds lors que celle-ci est dtermine par la nature et la position spatiale du sujet (comme les transperces, dont nous dirons quelques mots ultrieurement). Les points sont prolongs par une flche lorsque la traverse seffectue dans une certaine direction, donc avec un mouvement. Pour les emplois statiques, thoriquement sans direction, la tte de la flche nest pas prsente, la traverse ntant pas oriente. 4.4.2.2 Ce que montrent les modles Avec seulement trois phrases prototypiques contenant traverser, nous avons pu montrer par la modlisation son appartenance potentielle aux quatre classes aspectuelles majeures. Bien entendu, nos modles sont particulirement utiles et efficaces pour la prise en compte de facteurs temporels extrinsques au prdicat, voire la structure argumentale ; cest pourquoi nous lemployons notamment pour lanalyse de corpus, comme nous lindiquions au pralable.

4.4.3 Les modles spatiaux


4.4.3.1 Premier modle : Emploi prototypique, traverser la rue
Au milieu de la place, Robert se retourna. Le pre Girard tait debout sur le pas de sa porte. Robert prit la grand-rue et continua jusqu' la route de
201

l'Arbresle. L, il traversa et alla s'asseoir sur la murette qui borde le terrain vague. Clavel Bernard /Malataverne/1960
Figure 24 : Modle 1 pour traverser

Espace

Bo2-t2

Bo1-t1

E1

E2

Temps

Ceci est la reprsentation de parcours dans un espace vu comme tant unidimensionnel. Lobjet travers nest pas la surface qui couvre le repre mais bien chaque ligne verticale noire indiquant sa position un instant donn, position qui ne change quasiment jamais181. Le sujet bouge galement dans le temps sur cette surface, comme le montre la flche de points successifs. Cette dernire est rectiligne, ce qui signifie que la traverse en tant que mouvement est ininterrompue et quelle seffectue en ligne droite. Sauf indication contraire dans le co-texte de certaines occurrences (cf. figure 17 dans les diagrammes ontologiques, o le parcours seffectue en zigzags), nous partons du principe que les traverses prototypiques sont toutes rectilignes et ininterrompues. Les bornes Bo1 et Bo2 de lobjet, i.e. les limites de la rue dans sa largeur, sont confondues avec les bornes de laction Bt1 et Bt2, lesquelles fixent les limites de la traverse aussi bien spatialement que temporellement. En dautres termes, au-del des bornes Btx, il ny a pas encore et/ou plus, en principe, de traverse. Les bornes temporelles de lvnement E1 et E2 fixent les limites de la traverse dans le temps. Par dfinition, les bornes de laction et celles de lvnement sont orthogonalement concomitantes. Malgr ce que nous venons de dire, une des difficults qui apparat au travers de ce schma est que les bornes de laction se confondent avec les bornes de lobjet. Or,
181

Un objet travers est statique selon notre dfinition. Plus exactement, nous considrons que le fait quil soit ou non en mouvement ninflue pas sur la dtermination des bornes de la traverse sauf cas exceptionnels, peu ou jamais rencontrs dans la littrature.
202

nous admettons que traverser la rue nest pas une activit circonscrite la chausse lexicalise par rue, mais doit plutt reprsenter le passage dun ct lautre de cette rue. Autrement dit, les bornes vritables de la traverse dans ce cas sont celles de lespace qui borde la chausse, gnralement les trottoirs ou les bas-cts (cf. aussi les prolongements co-textuels de type jusqu la boutique en face ). Par convention, nous considrons la rue comme un ensemble bornes identifiables en admettant pour linstant que ce qui borde la rue fait partie de la rue lorsquon la considre comme lobjet dune traverse. Pour cet emploi dit prototypique, il y a : +tlicit, car les bornes de lvnement se confondent avec les bornes de laction ; +changement car la situation aprs traverse est diffrente de ce quelle tait avant quelle ft entreprise (test dimplication) ; +mouvement puisque le sujet bouge dans lespace. Il sagit donc dun ACCOMPLISSEMENT. 4.4.3.2 Second modle : Emploi habituel, traverser un territoire182
Il a eu aussi une passion pour une certaine Josette () qu'il a emmene traverser la France sur sa chre moto. Du coup, au cours d'une discussion sur les prochaines vacances, vous lui proposez un rallye deux sur une Mitsubishi 900. Buron Nicole de /"Chri, tu m'coutes ? : alors rpte ce que je viens de dire..."/1998
Figure 25 : Modle 2 pour traverser

182

Par territoire , nous entendons lensemble des espaces sur lesquels on peut se dplacer et qui peuvent tre assimils des surfaces. Une ville peut faire partie de cet ensemble mais nen est pas le prototype car elle peut aussi bien tre perue comme un objet trois dimensions (jungle urbaine, labyrinthe, ensemble de rsidences) qu deux dimensions (rseau de rues, chemins et routes)
203

Espace Bo2 Bt2 Bt1 Bo1

E1

E2

Temps

Lobjet est ici vu comme bidimensionnel, comme une surface. Cest la reprsentation dun parcours dans un espace deux dimensions. Dans loccurrence cidessus, le sujet traversant est la moto, bien quil soit exprim en termes Humain-anim (Josette et vous SUR la moto) ; la France est perceptible en tant quensemble de routes sur lesquelles Josette et vous se dplacent par moto interpose. A la place dune flche, un ruban de points aurait montr ici que le parcours peut seffectuer dans nimporte quelle partie du pays travers ; ce qui importe est quil ny ait pas de rupture (i.e. de tlportation ) dans la traverse du sujet. En effet, il nest pas envisageable que le parcours passe de Guret Landivisiau dun instant du temps au suivant183. Pour cet exemple, on notera : +changement car la situation aprs traverse est diffrente de ce quelle tait avant quelle ft entreprise ; +mouvement car le sujet se dplace, en considrant une nouvelle fois que le vritable sujet en mouvement est la moto ; pas de tlicit car les bornes de laction sont internes celles de lobjet dans les limites de lvnement. Il sagit donc dune ACTIVIT.

Une nouvelle fois, ce principe est valable seulement si le co-texte napporte pas de contradiction. Josette et vous peuvent trs bien avoir interrompu leur traverse moto en un point donn et avoir voyag par dautres moyens, moto larrt.
204

183

4.4.3.3 Second modle bis : Emploi habituel, traverser une ville


() un observatoire d'o il pourrait surveiller les oprations sans se mettre en pril. Protg au milieu d'une escorte, silencieux, l'Empereur s'loigna au petit trot en traversant Essling, ensuite un grand bois touffu qui reliait ce village au Danube. Rambaud Patrick /La Bataille/1997

Lobjet est galement vu ici comme bidimensionnel comme une surface ou ventuellement tridimensionnel sil est peru en tant quobstacle sur un parcours plus vaste que la simple traverse. Il sagit de la reprsentation dun parcours dans un espace deux dimensions, avec franchissement total de lespace vis. Dans loccurrence ci-dessus, le sujet traversant est lEmpereur et son escorte, exprim en termes Humain-anim ; Essling est perceptible en tant que entit citadine dans laquelle lEmpereur et son escorte se dplacent avec comme objectif de la dpasser, comme latteste le co-texte droit. Contrairement lexemple prcdent, la flche de points dans le modle doit tre rtablie dans tous les cas en lieu et place dun ruban, parce que le parcours seffectue dun point A extrieur la ville jusqu un point B galement extrieur et situ de lautre ct de la ville. Pour cet exemple, on notera : +changement car la situation aprs traverse est diffrente de ce quelle tait avant quelle ft entreprise ; +mouvement car le sujet se dplace ; +tlicit car les bornes de laction sont confondues celles de lobjet, conformment lorientation de lobjet que nous avons choisie dans le modle, et dans les limites de lvnement ; -momentan car le procs est vu avec dure : il a fallu un certain temps au cortge pour traverser la ville. Il sagit donc l dun ACCOMPLISSEMENT. 4.4.3.4 Troisime modle : transperce dynamique
(4) = Le gnral Espagne reoit une balle qui traverse la cuirasse. TR : A bullet went/shot through General Espagnes breast-plate (transpiercing)
Figure 26 : Modle 3 pour traverser 205

Espace

Bo1-Bo2

Temps Dans ce dessin, nous navons pas reprsent la situation avant et aprs la transperce. Nous ne pouvons pas ignorer dans ce cas que la traverse fait partie dune action plus vaste qui englobe le point de dpart de la balle (lorsquelle sort du canon du fusil), son parcours dans latmosphre avant datteindre la cuirasse, la traverse de la cuirasse et son point darrive qui est la poitrine du Gnral. Les caractristiques de ce modle sont : +changement car la situation aprs traverse est diffrente de ce quelle tait avant quelle ft entreprise ; +mouvement car le sujet se dplace ; +tlicit car les bornes de laction sont confondues celles de lobjet, conformment lorientation de lobjet que nous avons choisie dans le modle, et dans les limites de lvnement ; +momentan car le procs est vu comme immdiat. La transperce de la cuirasse est ainsi considre comme un climax, montrant quil sagit dun ACHVEMENT.

206

4.4.3.5 Transperce statique La flche traverse la porte et RESTE en travers de la porte. La flche de points successifs figurant le sujet est parallle laxe temporel et perpendiculaire laxe spatial, ce qui indique quil ne bouge pas. Les bornes de laction ne sont pas reprables et celles de lvnement demandent tre prcises.
Figure 27 : Modle 4 pour traverser

Espace Bo2

Bo1

E1 Nous relevons :

E2

Temps

-changement car la situation est dcrite un certain moment du temps, sans mention de ltat antrieur (en loccurrence) ni ventuellement postrieur ; -mouvement car le sujet est immobile ; - tlicit car les bornes de lvnement ne sont pas reprables ; - momentan car le procs est vu sans dure dfinie. Il ny a donc ni changement, ni mouvement ni tlicit. Il sagit l dun TAT. Il est amusant de noter que la transperce dynamique et son pendant statique sopposent pour tous les critres de distinction que nous avons utiliss, bien quelles ne diffrent dans leur dfinition que par le trait de mouvement (celui-ci impliquant tous les autres critres).

207

4.4.4 Les emplois mtaphoriques ou apparents


4.4.4.1 Traverses temporelles : parcours dans une priode de temps
Les pyramides ont travers les sicles TR : Pyramids travelled down (or went through) the centuries
Figure 28 : Modle 5 pour traverser

Espace

Temps Les modles pour les sens temporels de traverser sont trs proches des transperces dynamiques. En effet, la flche de points est oriente et toujours perpendiculaire laxe spatial. En revanche, il est non seulement parallle laxe temporel mais il fusionne avec totalement, lintrieur des bornes de lvnement, lesquelles ne sont pas dessines ici car nous ignorons o les placer hors contexte. Lobjet travers na donc pas dautre substance que le Temps lui-mme (0D spatial). Pour cet emploi, nous relevons : +/-changement car si le sujet est toujours le mme aux deux bornes de lvnement, lusure peut lavoir modifi. Dautre part, il nest pas exclu quun objet deux instants du Temps ne soit pas ncessairement le mme au sens physique. -mouvement car le sujet est immobile, ou tout le moins ninduit pas de mouvement reprable qui influerait sur la nature de la traverse ;
208

+/-tlicit car les bornes de lvnement sont volontiers extensibles (ce qui a travers les sicles antrieurs peut peut-tre continuer traverser les prochains) ; -momentan car le procs sinscrit intrinsquement dans une certaine dure. A premire vue, il peut sagir dun ETAT si lon neutralise les traits de changement et de tlicit, et nous nous contenterons de cette conclusion intermdiaire ce stade de lanalyse en attendant de lenrichir incessamment en confrontant les emplois temporels et certaines transperces. Notons que la simplicit apparente des modles temporels est due au fait quils ne font agir quune seule dimension alors que les modles spatiaux ont galement besoin du Temps pour leur reprsentation. 4.4.4.2 Traverses temporelles dmtaphorises : dpassement dun vnement vu comme ayant une substance temporelle
Jean a travers la crise. TR : John went through the crisis.
Figure 29 : Modle 5bis pour traverser

Espace

E1

E2

Temps

Cet emploi illustre lensemble des traverses que nous appelons temporelles mais qui ne seffectuent plus au sein dun objet prsent comme une dure mais au
209

travers dun vnement temporellement born : crise, guerre, etc. Nous les avons distingues du prcdent pour deux raisons : Premirement, la priode traverse possde une substance, une ralit quasi-matrielle que nont pas les laps de temps. Ces vnements sont intrinsquement borns, alors que les prcdents ne le sont que par ajout des informations concomitantes. En second lieu et conformment au rsultat qui nous intresse, leurs traductions en anglais ne sont pas quivalentes daprs le dictionnaire Robert & Collins. La flche de points est toujours perpendiculaire laxe spatial. En revanche, les bornes E de lvnement sont clairement identifies. Lobjet travers a donc ici plus de substance que le Temps lui-mme, ce qui lui confre une dimension supplmentaire, certes pas prcisment spatiale mais qui y ressemble trangement, et en fait un emploi mtaphorique lorigine. Nous relevons pour cet emploi : +/-changement car le sujet peut avoir t modifi184 au cours de cette traverse ; -mouvement car le sujet est immobile ou tout le moins ninduit pas de mouvement reprable qui influerait sur la nature de la traverse185 ; + tlicit car les bornes de lvnement sont identifies, et lvnement et laction sont orthogonales ; +/-momentan car le procs est vu dans une certaine dure mais il peut y avoir insistance sur le point culminant de laction plutt que sur la traverse elle-mme. A premire vue, il peut sagir dun accomplissement ou dun achvement mais les informations co-textuelles dont nous disposons ne sont pas suffisamment explicites
184

Nous noterons dailleurs que les traverses temporelles de cette catgorie induisent frquemment un changement dtat du sujet qui est notamment affect moralement quand il sagit dun humain. 185 Il nest videmment pas question dimaginer un sujet humain attendant immobile sur une chaise la fin dune crise ou dune guerre. Toutefois, le focus porte exclusivement sur lvnement et son dpassement, non sur tous les mouvements qui ont pu tre effectus par le sujet pendant son droulement.
210

pour en tirer des conclusions dfinitives ce stade. Une analyse contrastive plus approfondie montre que la traduction anglaise peut varier selon la classe aspectuelle dans laquelle nous placerons cet emploi. Cette variation en fonction du co-texte et des traits aspectuels concerne galement les autres acceptions de traverser.

4.5 Analyse contrastive 4.5.1 Rappel et retour sur le paradigme de traductions


Comme une vidence, nous rappelons que traverser hors contexte ne nous donne pas assez d'indices pour conjecturer quelles sont ses valeurs aspectuelles entires. Nous allons montrer maintenant quelles relations les traductions potentielles du verbe entretiennent avec la saturation des traits aspectuels que nous avons tent dexpliciter. Comme nous lavons indiqu, traverser peut tre traduit par un grand nombre de verbes anglais selon seulement un seul dictionnaire bilingue (Robert & Collins, dernire dition), entre cinquante et cent, probablement davantage (pour une explication au sujet de limprcision, nous nous rfrons Haton 2003186). Rappelons en quelques mots la typologie transitoire de ces traductions en anglais : Le plus gnrique, to cross, est essentiellement spatial. Son cas ne sera pas voqu dans cette partie dans la mesure o nous considrons quil neutralise les valeurs aspectuelles correspondantes au mme titre que traverser tout seul en franais. Quelques autres sont trs spcifiques (to negotiate, to sail, to ford, etc.) ; ces verbes, en tant que traductions ventuelles de traverser, sont fortement dpendants de la structure argumentale de traverser puisque chaque lexme verbal anglais fait rfrence un objet bien prcis.
Toutes les autres traductions ou presque sont tablies sur l'addition

d'une prposition un verbe de mouvement (y compris to get), crant un paradigme hirarchis : to come, go et get sont les verbes les plus communs, ils sont gnriques pour la traduction de traverser, que ses emplois soient spatiaux, temporels ou mtaphoriques. D'autre part, to walk, run, swim et ainsi de suite, illustrent la compositionnalit de l'anglais quant aux prdicats verbaux en fonction du mouvement
186

Dans notre premier article de 2003, nous dgageons une hirarchie des liens de traduction en prcisant que les liens les plus distendus concernaient les traductions indirectes, i.e. qui passent par un terme intermdiaire avant leur validation.
211

effectu lors de la traverse. Nous avons dj insist sur le fait que traverser, en tant que prverbe187 apparent188, porte en lui-mme la marque dune prposition et de laspect quon associe cette dernire. Toutefois, ses quivalents en anglais ne possdent pas cette caractristique dinclusion de la prposition ( lexception peut-tre de to cross qui se rapporte sans doute across), mais cette langue autorise aisment la mise en relation de verbes de mouvement ou apparents avec des prpositions plus varies et assez marques aspectuellement. Pour la suite de notre analyse contrastive, cest la distribution de ces prpositions anglaises ainsi que leur impact sur le calcul de laspect qui vont nous intresser.

4.5.2 Lintervention des prpositions across/through/over dans les parcours spatiaux


4.5.2.1 Distribution complmentaire apparente Auparavant, nous avons signal que l'anglais permet l'utilisation de trois prpositions over, across ou through afin d'exprimer un mme concept avec plus de prcision temporelle que les monolexmes comme to cross, car leur distribution contextuelle n'est pas alatoire. En revanche, il est plus difficile de dessiner une carte aspectuelle de traverser en franais sans observer systmatiquement son co-texte large. Lhypothse selon laquelle through, over et across coexistent au sein dune distribution complmentaire est conforme notre observation du lexique et a t partiellement confirme par nos relecteurs bilingues189 ; le choix de la prposition approprie dpend fortement de deux facteurs : si l'espace o seffectue la traverse est bidimensionnel ou tridimensionnel et aussi quel est le sentiment du locuteur au sujet de l'espace ou de la priode " traverser". Ce point de vue induit que cest le locuteur qui dispose des cls de lunivers aspectuel associ la situation quil dcrit. Ainsi, la
Un prverbe est un prfixe plac avant le verbe. Dans le cas de traverser, on pourrait tre tent de penser que le verbe est construit partir de la prposition travers. 188 En ralit, traverser nest lorigine ni un dnominal construit sur travers ou traverse ni le rsultat de la verbalisation dun prverbe. Daprs les informations tymologiques du TLF, il procde directement du verbe latin transversare qui est luimme issu de ladjectif transversus qui signifie transerval ou oblique. Le sens premier de traverser, savoir tre transversal , est donc motiv par le sens de ladjectif. Dans ces conditions, il sagit plutt dun verbe dsadjectival bien que cela ne soit plus vident en synchronie. 189 Merci Hilary Deneufchtel-Inwood (Anglaise, bilingue), Judith Kamalski (Nerlandaise, trilingue), Yvon Kromns et Emmanuel Haton (Franais, bilingues) pour avoir bien voulu relire et critiquer nos donnes.
212
187

prposition slectionne doit tre conforme sa vision lui de ce qui est travers. Dun autre ct, le traducteur devient le seul matre bord ce sujet ds lors que le locuteur initial est absent de lexercice de traduction. Il faut donc admettre que le dimensionnalisme diffre parfois entre la ralit et le point de vue de celui qui parle. Cest un des critres de dtermination de laspect dans le discours. Par ailleurs, le rcepteur du discours peut galement interprter une occurrence de faon diffrente en fonction de sa propre vision du monde. 4.5.2.2 Nature de la distribution partir des diffrents relevs que nous avons effectus, des hypothses que nous avons mises et des commentaires de nos relecteurs, nous sommes parvenus la distribution suivante pour les trois prpositions concernes : Across est employ pour des parcours spatiaux classiques surtout dans les espaces vus en tant quunidimensionnels, plus exceptionnellement bi- ou tridimensionnels. Cette prposition est la moins aspectuellement marque des trois et la plus intimement lie au verbe dorigine en tant quelle dnote le parcours en tant que tel. Through est employ pour des parcours spatiaux dans un espace trois dimensions ou considr comme tel, et galement pour des emplois temporels non marqus , pour les transperces (typiquement tridimensionnelles) et les vraies mtaphores. Over peut tre employ propos despaces n-dimensionnels, pour des sens spatiaux et temporels dans des conditions demploi trs prcises : ds lors que l'accomplissement est plus important que l'activit dans l'esprit du locuteur (avec notions de climax et dachvement, voire de dpassement au sens moral, dans la plupart des cas). Bien que nous la prsentions et la souhaitions comme telle, la distribution que nous suggrons nest pas strictement complmentaire. En effet, il peut y avoir recouvrement entre les trois prpositions, notamment entre across et through dune part, entre through et over dautre part. La confusion entre across et over est beaucoup moins vidente, les traits quils vhiculent tant trop loigns. Grce nos relecteurs, nous avons pu confirmer nos hypothses au sujet de cette distribution non-alatoire mais parfois concurrente. Eux et nous pensons que le sens de traverser et ses traductions peuvent changer sous l'influence de la configuration de l'espace.

213

4.5.2.3 Du prdicat verbal au co-texte : plusieurs faons dinterprter la mme occurrence Pour illustrer notre hypothse, observons loccurrence suivante :
Jean a travers la fort (traduction gnrique : John crossed the forest)

Traverser peut ici tre traduit par des prdicats contenant chacune des trois prpositions, comme confirmation de ce que Henriette Hendriks190 disait dans la confrence inaugurale au congrs STLL05 Rijeka. Trois interprtations sont disponibles : Premirement, la fort est une surface, vue comme un sol daprs le locuteur, sur laquelle Jean peut marcher. La prsence darbres ou dobstacles au sens large n'est pas pertinente pour borner l'action ; en outre, il n'y a pas trace de limites spatiales dans l'esprit du locuteur dans ce cas. La traverse est comparable une promenade. Pour cette interprtation, la fort doit tre vue comme bidimensionnelle. Across est le plus susceptible d'tre employ, over est exclu car le trait daccomplissement quil vhicule nest pas compatible avec lactivit promenade. Deuximement, la fort est un volume, pas seulement une terre sur laquelle on peut marcher. Dans ce volume, beaucoup d'obstacles empchent le voyage d'tre linaire : arbres, broussailles, branchages, ronces, rochers et ainsi de suite. Dans l'esprit du locuteur, la fort est tridimensionnelle. La traverse est comparable un passage au travers dun ensemble dlments entravants. Pour cette interprtation, through est le plus susceptible dapparatre, over est toujours exclu pour les mmes raisons que prcdemment. Across demeure possible la condition que le co-texte pallie sa relative fadeur aspectuelle par des descriptions supplmentaires. Troisimement, dans l'esprit du locuteur, la fort n'est pas une surface ni un volume ; la fort est... juste une fort. En d'autres termes, elle constitue juste une tape ou un obstacle dans le voyage de Jean, entre le dpart dun point A jusqu larrive au point B (Jean a travers la
190

Professeur lUniversit de Cambridge (UK), Henriette Hendriks inaugurait le congrs STLL05 ( Space and Time in language and literature Rijeka en 2005) auquel Laurent Mascherin et moi avons galement particip. Sa confrence portait sur lexpression de lespace en anglais au moyen de certaines prpositions, dont celles que nous prsentons ici.
214

fort pour atteindre le village voisin = John walked/went over the forest to reach next village). Daprs cette troisime interprtation, la reconnaissance des dimensions spatiales de la fort n'importe pas ; ce qui est pertinent est datteindre le point B, qui est en dehors de la fort. La traverse est comparable une tape dans un parcours qui linclut. C'est un accomplissement et, pour cette interprtation, over est appropri si lon se focalise davantage sur le point darrive que sur le parcours, mais across et through sont galement possibles, le choix dpendant nouveau du co-texte. Nous avons rencontr ce genre d'occurrence trs souvent dans notre corpus francophone, et videmment la dcontextualisation ne permet pas une lecture complte des traits aspectuels mis en jeu. Il est ncessaire dobserver le co-texte large pour les saturer en franais, alors que l'anglais peut partiellement fournir ces informations dans la structure lexicale du verbe. Voyons ce que cela donne en contexte :
() serait qu'ils envoient des patrouilles, mais s'ils le font, ils sont obligs de passer par le gu, prs de la ferme Badin, ailleurs ce n'est pas possible, il leur faudrait traverser des forts de ronces, mais ds que Badin les voit, il expdie son fils qui connat les raccourcis et vient nous avertir. Joffo Joseph /Un sac de billes/1973

Dans cet exemple, le co-texte restreint ne montre pas clairement laquelle des trois interprtations ci-dessus nous avons affaire puisque la phrase seule ne nous permet pas de savoir si le but de priple est bien au-del de la fort de ronces. Toutefois, la concordance de plusieurs lments grammaticaux et co-textuels (emploi du conditionnel et de lauxiliaire modal falloir, lobjet complment fort de ronces) nous donne quelques indices qui confirment que over est utilisable pour traduire cette occurrence, hypothse corrobore par le co-texte antrieur qui montre que le point darrive se trouve bien aprs la fort de ronces.
() tuver dans une petite usine cinq kilomtres. Nous avions pens que deux hommes pourraient sortir du camp en se cachant dans ce camion. trois kilomtres le camion traversait une fort assez paisse sur une route solitaire. C'tait l qu'il fallait sauter du camion. Ensuite, ce n'tait plus qu'une affaire de marche pied, de ravitaillement () Tournier Michel /Le Coq de bruyre/1978

La prcision au sujet de la fort assez paisse semble indiquer que le tridimensionnalisme est pertinent dans lanalyse de cette occurrence. Dautre part, llment co-textuel ctait l quil fallait sauter du camion montre que la traverse de la fort nest pas accomplie car elle sarrte en son intrieur. Pour ces deux raisons, through est sans doute possible le meilleur choix parmi les trois prpositions.
215

() avec des filles dans des botes de Hong-Kong ou de Berlin. Pandora riait. Elle tait gurie. Elle tait vaccine. Elle avait subi l'preuve qui allait lui permettre de traverser sans encombre les forts enchantes et les fournaises ardentes. Le mal qui la rongeait tait pass Luis Miguel. De temps en temps, fruit amer, j'imagine, () Ormesson Jean d' /Tous les hommes sont fous/1986

Cette occurrence de traverser la fort est manifestement une mtaphore, laquelle nest pas comprise dans les acceptions que nous avons releves dans les diffrents dictionnaires, moins de considrer cet exemple comme un emploi temporel pour lequel les forts enchantes et les fournaises ardentes seraient comparables des crises ou des vnements dun type particulier. Dans la majorit des cas, les traductions des emplois mtaphoriques de traverser contiennent la prposition through. Il existe beaucoup dautres types de parcours influencs par le co-texte dans Frantext et il eut t trop fastidieux den faire un relev exhaustif. En voici tout de mme quelques spcimens synthtiss pour complter les prcdents :
Parcours spatial, description du paysage, pas de connotation dobstacle

ni rellement dtape across. Co-texte pertinent.


() la terre grasse et rouge verdoie adosse une chane continue de montagnes qui la protge et l'ombre : le bl est dj haut, la vigne avance ses premires feuilles. On traverse des forts de nfliers en fruits ou des bosquets compacts d'orangers dont l'enivrant parfum assaille par vagues successives. Patras est affreux : une ville crase, () Don Michel /Le Balcon de Spetsai/1961

Emploi mtaphorique, voyage initiatique. Dpassement de soi over, ou passage mental dans un environnement touffu through. Co-texte ncessaire.
KADIDJA, regardant Slimane : Cingle ? SI SLIMANE, souriant : Comme toi tout l'heure... elle traverse la fort... Elle se dpiaute de la raison, pour arriver pure et comme toi connatre les rapports de l'espace et de la course et le nom des mouches. Genet Jean /Les Paravents/1961 () avec des filles dans des botes de Hong-Kong ou de Berlin. Pandora riait. Elle tait gurie. Elle tait vaccine. Elle avait subi l'preuve qui allait lui permettre de traverser sans encombre les forts enchantes et les fournaises
216

ardentes. Le mal qui la rongeait tait pass Luis Miguel. De temps en temps, fruit amer, j'imagine, () Ormesson Jean d' /Tous les hommes sont fous/1986

Parcours spatial, pas de but hors lobjet, celui-ci vu comme un environnement hostile through. Co-texte ncessaire.
() et vendre n' taient en ralit qu' une seule et mme chose un simple besoin celui de se rassurer, comme des gamins qui sifflent ou chantent fort pour se donner du courage en traversant une fort la nuit, ce qui expliquait pourquoi le chant en chur faisait partie au mme titre que le maniement d' armes ou les exercices de tir du programme d' instruction () Simon Claude /La Route des Flandres/1960

tat spatial, sujet inanim. Co-texte pertinent. Dans lexemple suivant, les adjectifs paisse et infeste de dnotent la prsence dobstacles imposants et proposent une lecture de la fort comme un vritable espace tridimensionnel. La majeure partie du trajet nest pas un sujet possdant un but darrive au-del de la fort through.
La pirogue mtallique de terre Le gouffre de la grande hyne noire cette poque, le pays tait encore fortement bois. La majeure partie du trajet traversait une paisse fort infeste d'hynes et de panthres. mi-route, il fallait longer sur notre gauche une grande et sombre excavation appele Dounfing. B Amadou Hampt /Amkoullel, l'enfant peul/1991

Parcours spatial, ncessit daller au-del et entre-temps de traverser un espace jonch dobstacles through, over, ou les deux. Co-texte pertinent.
() serait qu'ils envoient des patrouilles, mais s'ils le font, ils sont obligs de passer par le gu, prs de la ferme Badin, ailleurs ce n'est pas possible, il leur faudrait traverser des forts de ronces, mais ds que Badin les voit, il expdie son fils qui connat les raccourcis et vient nous avertir. Joffo Joseph /Un sac de billes/1973

217

4.5.3 Les parcours temporels


Aprs avoir bti nos reprsentations sur le principe du quadridimensionnalisme, il nous reste rpondre un certain nombre de questions pour caractriser les emplois temporels comparativement aux emplois spatiaux : Le Temps est-il un objet dynamique ? Voyons ce qui se produit quand l'objet travers est un intervalle de temps. Initialement, nous pensions que les sens spatiaux et temporels devaient tre opposs, car pour les parcours spatiaux dynamiques le sujet se dplace et l'objet est statique (avec une valeur durative, (1)), alors que les emplois temporels impliquent un sujet immobile et conceptuellement un objet mobile qui est le temps lui-mme (2).
(1) Ils traversrent une partie de la cour, puis montrent au premier tage de la caserne. Clavel Bernard /Le Cur des vivants/1964 (2) () elle acquiert une duret remarquable aux grandes chaleurs ; on rend donc l' oeuvre quasiment inaltrable grce la cuisson : la forme phmre devient ainsi apte traverser les sicles. Fontaine Georges /La Cramique franaise/1965

Le sujet humain de (1), ils, soppose linanim la forme phmre de (2). Dautre part, lobjet inanim et spatialement reprable de (1), une partie de la cour, semble galement sopposer lobjet les sicles, lequel correspond une priode temporelle floue. Lobjet est dynamique dans cet emploi car cest lavance du temps, i.e. sa traverse, qui est dnote et non pas la dure elle-mme. Peut-on transpercer le Temps ? Lobservation des modles et des paradigmes de traduction nous fait plutt tendre vers un rapprochement des emplois temporels avec les transperces statiques. Par la modlisation, ils partagent la particularit de prsenter un sujet traversant immobile et figur par une succession de points formant une ligne perpendiculaire laxe spatial et parallle laxe temporel, avec comme seule diffrence le fait que cette ligne est confondue avec laxe temporel pour les premiers. Par ailleurs, les bornes de lvnement napparaissent pas clairement dans les modles car la mention dune traverse temporelle ou dune transperce statique ne prsuppose pas (sans co-texte appropri) que le locuteur connat prcisment le moment o la traverse a dbut. Toutefois, la borne finale de lvnement peut tre arbitrairement fixe au prsent de lnonciation, la borne de lnonciateur. Malgr cela, nous supposons que la traverse continue aprs lnonciation et ne sarrtera qu lenlvement du sujet qui transperce pour les uns, par la destruction, laltration ou loubli pour les autres. Pour
218

cette dernire raison galement, nous nutilisons pas le point de vue du locuteur dans notre travail de modlisation. Des traductions leur sont galement communes, commencer par lemploi quasi-systmatique de la prposition through qui dnote le passage au travers dun espace ou dun objet visiblement tridimensionnel lorsquil est transperc. Les verbes de mouvement, supports de la prposition, peuvent galement tre les mmes, la plupart du temps gnriques et peu motivs smantiquement comme to get, to go, to come ou to pass. Est-il possible de passer par la fentre du Temps ? Nos diffrentes approches lexicales et formelles prouvent que les emplois temporels sont beaucoup plus proches des (trans)perces que des voyages et parcours. Aussi, nous pensons que le temps ne doit pas tre vu comme une ligne - ou un axe simple dans un repre, comme nous le reprsentons par commodit - ni comme un objet mobile mme si la conceptualisation de lavance du temps nous fait parfois percevoir le contraire, ni comme une rivire imptueuse, ou pas, (comme prsent dans Borillo 1996) parce que cette dernire vision impliquerait que le temps se dplace indpendamment de lespace et que chaque morceau du monde spatio-temporel ne se dplace pas seul ou marche le long de la rivire. Daprs nos modles et notre tude contrastive, nous faisons lhypothse que le temps peut tre peru comme une fentre ou une porte ouverte au-travers de laquelle le sujet va d'un prsent... qui est dans le pass jusqu un prsent... dans le prsent. De ce point de vue, les sens temporels sont de vrais emplois dynamiques au sens aspectuel, bien que cela ne rsolve pas le problme de la momentanit. Tout ceci pourrait expliquer pourquoi les traductions en anglais pour les perces statiques tridimensionnelles et pour les priodes temporelles dnotes par traverser sont presque toutes identiques. Nous devons nanmoins distinguer les priodes temporelles des vnements. Avec Jean a travers la crise, il est tout fait possible de traduire par John got through a crisis ou bien John got over the crisis ou de faon encore plus prcise smantiquement, John got through a crisis and then get over it 191. Cet exemple ne contredit pas vritablement notre hypothse, puisque nous admettons que getting over an event signifie successfully and completely getting through this event, without damage, etc.192 La diffrence est moins explicite en franais, les deux occurrences to get through a crisis et to get over a crisis pouvant tre traduites par traverser la crise sans distinction co-textuelle.
191 192

Traduisible par Jean a travers la crise et la surmonte . Ou getting over an event correspond en franais la glose traverser un vnement compltement et avec succs, sans dommage, etc.
219

Entre les deux traductions, la nuance est rechercher dans le dpassement de lvnement travers : sil sagit dune priode vcue douloureusement par le sujet traversant, over pourra tre employ pour indiquer que ce dernier a non seulement survcu lvnement mais aussi fait le deuil de la douleur induite par lobjet, et seulement dans ce cas. Ainsi, il y a deux conceptualisations distinctes pour les emplois temporels de traverser, l'un avec le temps vu comme surface mince et homogne, proche des emplois statifs, et un pour des vnements vus comme des volumes franchir ou dpasser, plus prs des accomplissements voire des achvements.

4.5.4 Les emplois mtaphoriques


Nous considrons comme emplois mtaphoriques de traverser toutes les occurrences qui ne concernent pas un parcours dans un espace identifiable ni les traverses temporelles, quelles soient effectues dans un intervalle dfini ou au travers dun vnement. Pour dterminer ce qui relve de la mtaphore lexicale et ce qui nen est pas, nous acceptons le point de vue suivant :
Dire que tout langage est mtaphorique (), cest dire que nombre de mots conus aujourdhui comme non-mtaphoriques, sont en fait des mtaphores teintes. Quelle quait t lorigine du langage, il reste que dans son emploi, un moment donn, certaines expressions sont conues comme figures, dautres non. La question de la mtaphore doit trouver dabord une solution synchronique.

Todorov, 1967 Outre que Todorov suggre que la dsignation de la mtaphore est de la responsabilit du linguiste synchronicien, nous entrevoyons dans cette citation un indice de lvolution naturelle du langage qui transforme le potentiel smantique de chaque terme dune langue en fonction des besoins de ses locuteurs ou du hasard de la crativit. De semblables considrations ont abouti une tude approfondie au sujet du verbe aborder au chapitre prcdent. Comme confirmation de ce que venons de dire, lobservation du corpus textuel FRANTEXT de 1960 nos jours fait apparatre de grandes disparits dans la frquence dapparition et dans la manipulation des acceptions que nous nommons mtaphoriques. Pour ce qui concerne traverser, les emplois mtaphoriques sont tous ceux qui ne permettent pas une visualisation de la traverse autrement que par limagination et labstraction. Nous avons remarqu que plus les textes de rfrence nous sont contemporains, plus le nombre de mtaphores de la traverse est lev. Dautre part, nous notons
220

galement une extension de la sphre dinfluence de lunit verbale, laquelle nest plus cantonne lemploi figur dorigine : une ide qui traverse lesprit . En ne considrant que les occurrences de 1985 nos jours, certains emplois sont ininterprtables par la lexicographie et du coup intraduisibles sans faire intervenir larbitraire du lecteur. Tant que les emplois mtaphoriques se limitaient la traverse dune ide dans un esprit, il tait facile de circonscrire lanalyse un paradigme restreint pour les arguments sujet et objet. Le premier contenait ide, mot, pense et leurs synonymes ; le second tait constitu du champ lexical du cerveau en tant que sige de la pense, esprit, me, etc. Plus les uvres consultes sont rcentes, plus les mtaphores sont varies et difficiles dcrire. Dune part, le paradigme des sujets potentiels augmente considrablement, en partie grce au phnomne dellipse : la mtaphore se lexicalisant de plus en plus, il est davantage acceptable de remplacer le syntagme une ide par le contenu de lide. On peut noter aussi que les synonymes ou mots apparents ide sont galement plus nombreux au fur et mesure du temps. Enfin, les sens mtaphoriques se dveloppent, senrichissent et induisent de nouvelles acceptions qui ne sont pas lexicalises, elles. Cest le cas de ce que nous avons appel prcdemment les parcours initiatiques pour lesquels une interprtation immdiate nest pas impossible mais demeure un peu hasardeuse sinon un peu floue.
L'ide d'une petite voiture me traversa galement l'esprit cent l'heure, avec moi au volant. Gary (Ajar mile) Romain /la promesse de l'aube/1960 Cette tordue commence siphonner ! C'est ce qui en clair traverse l'esprit d'Armand. Simonin Albert /Du mouron pour les petits oiseaux/1960 C'est ce moment qu'une ide lancinante et terrible lui traverse l'esprit. Peut-tre n'a-t-il tromp personne, ni les geliers, ni les codtenus, ni surtout lui-mme. Fanon Frantz /Les Damns de la terre/1961 Une inquitude lui traversa pourtant l'esprit. - Au fond, je dcide sans rien te demander, dit-il, mais cela pourrait ne pas t' arranger du tout que je rentre Paris en mme temps que toi. Droit Michel /Le Retour/1964

Jusquau milieu des annes 1960, lide est le sujet de loin le plus rpandu pour les emplois mtaphoriques. Ce nest rellement quaprs que lon voit apparatre des termes du mme champ lexical, ou littralement le contenu de lide.
221

Je m' tais fabriqu un tas d' excuses idiotes et c' est la plus idiote qui m' a travers l' esprit: ne me faites pas de mal, je ne suis pas vraiment mauvaise, je voulais voir la mer. Japrisot Sbastien /La Dame dans l'auto/1966 Que de fois son cri terrible me traverse l' esprit: "Je ne suis pas votre mre; une mre ce n' est pas a, ce que je suis!" Ainsi prvenait-elle ses pauvres enfants dans un mouvement perdu de sincrit. Monsi Irne /Nature morte devant la fentre/1966 Deux minutes avant d' entrer, la personne de Georges m' a travers l' esprit et je me suis dit: "Surtout ne pas oublier de parler Marie de la faillite de cet imbcile; Dutourd Jean /Pluche ou l'amour de l'art/1967 La mala noche... Le mot me traversa l'esprit et y fit tout coup un sillage veill. Dans la pnombre vacillante des bougies, les images y glissaient sans rsistance () Gracq Julien /La Presqu'le/1970 Un souvenir venait de traverser l'esprit de la mm et elle le jetait tout cru. Mm, c'est quoi, l-bas? Tout se nommait: les hameaux, les moulins, les fermes, les chemins () Sabatier Robert /Les Noisettes sauvages/1974 Cette conversation et surtout le trait de lumire qui traversa l'esprit d'Adle lorsque retentirent les trois coups de sonnette de Bob la soulagrent dfinitivement : aucun de ses frres n'aurait aim une telle femme ! Delay Florence /Le Ae Ae de la corne de brume/1975 Aprs avoir aval son verre de vin blanc, Edmond eut l'esprit travers par une subite lueur. - Dieu existe parce qu'il est ! proclama-t-il avec autorit. L'Hte Jean /Le Mcrant ou les preuves de l'existence de Dieu/1981

4.5.4.1 Quels critres appliquer pour les mtaphores ? Les emplois mtaphoriques habituels de traverser sont dabord caractriss par les arguments sujets et objets. Les premiers sont rechercher dans le champ lexical de lide, ou de faon plus gnrale tout ce qui correspond une image mentale (pense, souvenir, etc. ) ou leur contenu. Les seconds sont strictement restreints des syntagmes nominaux dont la tte est esprit dans presque tous les cas, ce qui en facilite le reprage. Ensuite, nous remarquons que les emplois mtaphoriques sont des emplois semi-rflchis impliquant la prsence dun pronom clitique indirect correspondant la personne dont lesprit est travers, ou par lemploi du dterminant possessif son.
222

La constance de ces critres syntaxiques et smantiques explique que nous navons pas besoin de faire une analyse aspectuelle dtaille des emplois mtaphoriques de traverser, tout le moins pour en caractriser le sens. Dans le dernier exemple tir de Frantext que nous citons, ladjectif obsdante et surtout ladverbe priodiquement montrent que nous avons affaire un aspect itratif, mais contrairement aux emplois spatio-temporels du verbe cela na pas dinfluence sur le choix des lexmes de traduction. En revanche, cette itrativit peut se retrouver dans la slection des temps verbaux. Pour les autres emplois mtaphoriques qui ne font pas intervenir lide comme sujet, lesprit comme objet ou leurs quivalents synonymiques, il est dj plus difficile den caractriser le sens. Comme nous lavons dj montr, la modlisation des sens mtaphoriques est rendue impossible par leur caractre abstrait ; dautre part, le potentiel mtaphorique de traverser dpasse le cadre des acceptions connues pour le verbe en lexicographie. Cest pourquoi nous devons nous contenter dessayer dinterprter ces occurrences particulires au cas par cas, en proposant ventuellement la prise en compte de nouvelles acceptions ou en effectuant le rattachement de certains emplois des acceptions dj connues, par exemple le rapprochement entre les traverses initiatiques et les parcours temporels de type 2, i.e. celles qui correspondent la traverse dune priode bien dtermine.

4.6 Conclusion de la traverse


En premier lieu, comme pour tous les autres verbes, le sens du prdicat contenant traverser est dtermin par la nature smantique de ses arguments. En raison de la polysmie du verbe (quatre sens majeurs, eux-mmes sparables en plusieurs sous-sens) et de la faible lexicalisation du type de traverse effectue, ce sont dabord le sujet et lobjet qui nous permettent de dterminer de quel type de traverse il sagit. Toutefois, cette reconnaissance des arguments ne donne pas pour autant dinformation sur le contenu spatial et temporel des traverses effectues, ce qui nous amne au point suivant. Comme nous lavons montr, la recherche des bornes de laction et de lvnement donne des informations essentielles quant au contenu aspectuel des traverses. Or, ces bornes peuvent parfois tre caractrises par le co-texte large puisquil arrive quon ne puisse parler daccomplissement quen faisant rfrence aux propositions voire aux phrases qui suivent loccurrence de traverser. Les syntagmes prcisant le type de mouvement effectu (cf. en zigzaguant ) compltent galement le sens du prdicat du point de vue du mouvement, et influent directement sur la traduction. En anglais, le choix du prdicat verbal pourra tre plus volontiers effectu en fonction du circonstant de mouvement, et saccompagner de la prposition idoine (to zigzag through ou across (voire over) dans le cas que nous citons).
223

Les modles que nous avons conus pour ce chapitre montrent limportance de ces notions de bornes et de mouvement pour la reprsentation du verbe traverser en contexte. La plupart des facteurs que nous avons dgags pour la caractrisation de laspect vhicul par traverser sont difficiles rpertorier dans un dictionnaire. Le contenu smantique et temporel dun verbe en contexte peut tre soumis linfluence de ses arguments, dadverbes et de circonstants de toutes sortes qui clairent sur la configuration du temps et de lespace, de phrases antrieures ou postrieures prcisant les bornes de laction, et de tous les lments de langue qui apportent des prcisions sur lensemble du prdicat. Noublions pas que le premier discriminateur pour laspect est le sens du verbe indpendamment de tous les ajouts qui en prcisent la porte ni que linterprtation que nous faisons des occurrences littraires peut tre remise en question au nom du dcalage entre les intentions de lencodeur et celles du rcepteur. Comme conclusion prliminaire, nous avons voulu dmontrer que les structures aspectuelles sont la plupart du temps importantes pour slectionner la traduction approprie d'un prdicat, que ces structures soient portes par le prdicat lui-mme ou par le co-texte large (sans parler du contexte non discursif). Tout au long de ce chapitre, nous avons tent de mettre en avant plusieurs phnomnes. Tout dabord, le n-dimensionnalisme est un facteur trs important dans la conceptualisation du verbe : L'espace et le temps ne peuvent pas tre spars pour dcrire et modeler sa structure aspectuelle. Ensuite, un verbe comme traverser a potentiellement beaucoup de structures aspectuelles qui ne sont pas incluses dans le lexme, mais qui sont seulement satures par le contexte et le co-texte, comme beaucoup de linguistes ladmettent dsormais. Enfin, notre tude contrastive prouve que l'anglais a en apparence plus d'outils directement lexicaux que le franais pour distinguer ces structures. En franais, seul le contexte permet dtablir la valeur aspectuelle pour traverser indubitablement et fixer ses bornes. Pour terminer, nous esprons avec raison que nos modles seront utilisables pour dcrire d'autres verbes lis traverser, et peut-tre tous les prdicats impliquant l'espace et le temps. La prise en compte des nouvelles donnes est plus dlicate au sujet du verbe traverser. Certes, nous russissons dterminer de faon quasi-exhaustive quels sont les lments du discours qui participent la caractrisation de laspect de ce verbe en contexte. Dautre part, laspect vhicul par les traductions anglaises est galement reprable dans la majorit des cas. Cela tant, ces nouveaux lments demeurent difficiles rpertorier de faon ordonne et, surtout, ne tmoignent pas dun comportement stable dune occurrence lautre.
224

Dans ce cas, le problme peut tre pris lenvers : si lenvironnement langagier des occurrences de traverser ne permet pas un reprage systmatique de laspect en fonction de leur forme, autant faire porter ces informations par les traductions ellesmmes. Reprenons notre exemple de la traverse de la fort pied : trois traductions principales se dtachent, walk across, walk through et walk over. Le cotexte de traverser en franais est trop instable pour cibler la vedette la plus adapte, et le verbe ne porte pas en soi de trait aspectuel activ ; de leur ct, les lexmes verbaux anglais sont implants avec leurs caractristiques particulires (infoscompls). Pour notre travail de modlisation, cest en faisant supporter par lentre de la traduction les traits smantiques et aspectuels particuliers que nous avons le plus de chance davoir des rsultats cohrents lors du transfert interlangue. A cela nous ajouterons que les donnes pragmatiques de type infoscompls ne sont pas des fragments de langage littral, ni des types prdfinis. Leur prsence doit permettre un utilisateur de dterminer son choix en fonction de lenvironnement textuel du verbe quil cherche traduire.
Figure 30 : Fragment de CSMU pour traverser en contexte
motsource mot-cible syn LS syn LC colloc objet colloc sujet constr LS constr LC registre infos complmentaires

Ftraverser Awalk across Ftraverser Awalk through Ftraverser Awalk over Ftraverser Arun across Ftraverser Arun through

territoire territoire territoire territoire territoire

Objet uni- ou bidimensionnel marche Objet tridimensionnel marche Aspect dachvement marche Objet uni- ou bidimensionnel course Objet tridimensionnel course

Il est probable que la principale lacune de notre tude est que les emplois du verbe traverser ont t analyss sans aucune rfrence aux autres verbes franais qui peuvent se substituer lui, i.e. ses synonymes et parasynonymes en langue source. Cest pourquoi une autre tude serait utile pour montrer toute linfluence des relations lexicales lintrieur dun champ bien dfini. Pour prsenter ce phnomne, entre autres considrations, nous avons dcrit au chapitre prcdent une autre collaboration de recherche impliquant cette fois plusieurs membre de lILF dans le cadre dune rflexion globale sur la transitivit : les verbes de parole et leur comportement en contexte dans les textes littraires et leur rapport, ou leur apport, la grammaire traditionnelle et aux dictionnaires.
225

Pour terminer, revenons aux deux hypothses formules dans lintroduction au sujet de ce chapitre et de la fin du prcdent : Premire HYPOTHSE : Ces analyses produisent des relations lexicales quivalentes et/ou complmentaires aux dictionnaires. Seconde HYPOTHSE : Ce quon retrouve comme constantes syntaxicosmantiques dans une langue se retrouve dans les autres langues de manire quivalente. Le rsultat pour la premire hypothse est que les corpus littraires font apparatre des complments en grand nombre aux donnes lexicographiques, tant syntaxiquement que smantiquement. La fantaisie des constructions recenses et des acceptions nouvelles est finalement la mesure de la crativit des auteurs romanesques. Par ailleurs, si beaucoup des occurrences tudies respectent le canevas dacceptions observables dans les dictionnaires, nous notons quil existe des diffrences subtiles entre chaque emploi, lesquelles portent aussi bien sur laspect du prdicat (comme pour traverser) que sur le contexte extralinguistique, sur lequel nous avons hlas peu de prise faute de pouvoir nous mettre la place des crivains. Pour la seconde hypothse nous rpondons : manifestement oui, la crativit lexicale nest pas lexclusivit du franais, et il possible de rendre transitif un verbe intransitif dune autre langue, sil traduit une forme transitive du verbe franais intransitif auquel il est associ habituellement. Toutefois, la fantaisie que lon observe pour certains verbes conduit celui-ci changer de sens par rapport aux donnes lexicographiques et de fait lui accoler ventuellement dautres traductions. Ce dernier point nous pose rellement problme car nous navons jamais prtendu rcrire les dictionnaires bilingues. Nanmoins, nos modles autorisent dans un premier temps le recensement de donnes isoles , cest--dire ne proposant pas de candidats mais faisant juste apparatre les critres qui permettraient de choisir ceux-ci. larrive, le rsultat attendu est que lon peut construire un graphe enrichi des informations syntaxiques et contextuelles en procdant finalement de manire identique ce qui est dcrit au chapitre II. Le rsultat constat est lapparition dun graphe encore plus riche que le prcdent pour les verbes fortement reprsents (voir rsultats des hypothses 1 et 2) et une disparition force des verbes sous-reprsents ou pas reprsents du tout, lesquels ne sont finaliss dans nos bases qu partir des acceptions, constructions, traductions et co-textes lisibles dans les dictionnaires monolingues et bilingues. propos de ce dernier point, nous noterons que cest ce qui fait une des grandes originalits du TLF, lequel prsente en entre des mots quon ne retrouve dans aucun autre ouvrage lexicographique mais en ignore certains, pourtant apparents dans des dictionnaires plus grand public, parce quils nont pas t utiliss par les auteurs des textes saisis dans la base littraire FRANTEXT qui a servi nourrir lessentiel du TLF.
226

Au final, le travail sur corpus na pas conduit modifier les bases de donnes que nous avions constitues pralablement, au sens o il na pas t ncessaire den changer la structure pour lenrichir. Les dictionnaires tant eux-mmes des bases issues du dpouillement de corpus, au moins pour partie, nous pouvons considrer que les donnes initiales peuvent tre compltes grce au corpus. Cependant, nous ne nous permettrons pas de modifier les donnes du dictionnaire quun corpus trop restrictif na pas permis de rpertorier. De ce fait, lanalyse faite partir de FRANTEXT ne peut servir qu enrichir la base. Dans loptique de construire un graphe multilingue partir dune base de donnes mallable, il ny a aucune ncessit entrer des donnes exactes et finies ds la premire criture de cette dernire. Des ajouts successifs et des corrections sont implantables tout moment, ce qui contredit la critique ventuelle selon laquelle le graphe est faux si le dictionnaire est faux car rien noblige conserver des donnes fausses si elles sont reconnues comme telles. Dans le chapitre suivant, nous allons prsenter en dtail le mode de fonctionnement de ces bases de donnes ainsi que lalgorithme que nous leur associons pour permettre limplantation des CSMU.

227

CHAPITRE IV Modlisation et algorithme de construction du graphe des Champs Smantiques Multilingues Unifis ou CSMU

228

1. Objectifs de la modlisation et Exploitation des donnes 1.1 Problmatique originelle


Parvenu ce stade de ltude sur les verbes, notre objectif principal est dsormais la constitution de graphes lexicaux multilingues illustrant la non biunivocit des correspondances lexicales entre les langues, et permettant de la dpasser. En effet, nous avons dj insist sur le fait quil est rare qu un terme en langue source corresponde une seule traduction en langue cible. Par surcrot, le dcalage inter-langue grandit de manire exponentielle chaque ajout dune langue dans ltude. Pour toutes ces raisons, nous avons besoin dun mode de reprsentation et dexploitation des donnes souple, modulable et fidlement reprsentatif de la ralit du lexique. Notre choix sest port sur la constitution de champs lexico-smantiques implantable partir dun algorithme de construction de graphe et apparaissant sous la forme dune base de donnes contrle par un faisceau de critres distinctifs. Ce sont les Champs Smantiques Multilingues Unifis (CSMU) dont nous avons fait une premire et brve prsentation au chapitre II. De par leur nature automatise, les CSMU sont des graphes de relations lexicales lecture multiple : les CSMU pouvant tre visualiss dans leur totalit ou bien partiellement par lappel dune lexie qui y est prsente. Dans lidal, ils pourront galement tre interrogs sur des critres restrictifs comme le choix des langues vises, les registres demploi, etc. Dans la gense de nos travaux, nous voquons gnralement le terme-source en dehors de toute comparaison avec les units lexicales de la langue laquelle il appartient. Or, comme le montrent nos diffrentes approches linguistiques, il nest pas envisageable de faire une tude lexicale multilingue cohrente sans tudier les champs smantiques de chaque langue de ltude dans leur ensemble. La multiplicit des liens synonymiques et parasynonymiques des units dune mme langue entre elles ainsi que des liens de traduction dune langue une autre est lorigine de notre volont de reprsenter toutes les informations au sein dun mme espace. Les niveaux de synonymie dcrits plus loin sont destins distinguer les liens de synonymie dcrits dans des ouvrages lexicographiques monolingues des liens plus complexes tablis partir des dictionnaires bilingues. Au final, il sagit toujours de synonymie, quelle soit intra-langue ou inter-langue193, cette dernire trouvant une illustration observable dans le langage des enfants bilingues, lesquels sont susceptibles dinsrer des termes de lautre langue quils matrisent dans un nonc, sils les jugent plus appropris dans un contexte prcis194.

193

Au nom de la synonymie que nous redfinissons notre faon au Chapitre I, afin de permettre la dsignation de liens de synonymie entre termes de langues diffrentes. 194 Processus de code-switching .
229

1.2 Problmatique enrichie


Grce aux tudes linguistiques sur corpus, nous avons montr lintrt de complter les donnes lexicographiques par une tude approfondie des emplois inhabituels de la plupart des verbes polysmiques. Ltude approfondie du smantisme de traverser et de son transfert en langue cible nous a conduit une recherche de reprsentation plus formelle de ses traits aspectuels sous la forme de modles mathmatiques idoines. Les modles que nous proposons sinscrivent dans une vision quadridimensionnelle qui rconcilie Temps et Espace dans le mme Univers (cf. Einstein 1994 trad., Quine 1960, Denis & Muller 2004, Haton & Mascherin 2005). Dans une perspective beaucoup plus large, ils doivent permettre la description smantique et aspectuelle de lensemble des units verbales dont linterprtation suppose lexistence dune situation dnonciation base sur le temps et lespace, ce qui concerne la grande majorit des prdicats. Il ny a pas de sparation de facto entre temps et espace do on peut tout reprsenter par lintermdiaire dun repre orthonorm avec des axes spatio-temporels diffrents. Ce repre ne donne en apparence quune seule dimension spatiale, il en manque donc deux. Souvenons-nous que lobjet peut tre unidimensionnel (une ligne renouvele dans le Temps), bidimensionnel (un plan lgyptienne renouvel dans le temps) ou tridimensionnel (un volume lgyptienne renouvel dans le temps). En revanche, nous rappelons que le sujet qui traverse peut tre n-dimensionnel sans incidence sur le sens du procs, cest--dire que ses dimensions ne sont pas pertinentes dans cette reprsentation. Lobjet travers existe sur une priode temporelle donne, cest donc par rapport au temps que nous pouvons reprsenter les dimensions spatiales de traverser. Par exemple, la route (objet travers ou site) existe partir du moment o elle a t construite jusquau moment o elle est dtruite, entre temps il y a lusure. Sur laxe temporel, nous avons repris la perspective de Reichenbach qui introduit 3 points de reprage E, R et S, perspective selon laquelle laspect de la prdication est reprsent par la structure interne de lintervalle E. Vet et Gosselin prfrent parler dintervalle, en effet, laspect lexical (type de situation), nest pas un point mais un intervalle de temps comme nous avons pu le faire remarquer, compris entre E1 (dbut de lvnement) et E2 (fin de lvnement). Le lien entre cette modlisation et les CSMU rside dans notre souhait dintgrer terme lensemble des phnomnes textuels qui ont une incidence sur un parcours de traduction. Compte tenu de la trop faible avance de nos recherches propos de la transformation de nos modles en donnes directement intgrables dans la base, nous nen parlerons presque pas dans ce chapitre. Soulignons que ce dernier point constitue notre principal objectif de recherche pour lanne venir si nous

230

parvenons (faire) programmer la transformation de base de donnes en graphe multilingue195.

1.3 Mthodologie et Travaux Prliminaires 1.3.1 Vers les CSMU


Pour reprsenter nos donnes, nous proposons la cration de champs smantiques multilingues unifis, dirigs par un rseau qui fait apparatre les liens smantiques entre les lexies dune mme langue autant quentre celles de langues diffrentes. Chaque unit du rseau est porteuse de ses propres informations linguistiques, supposes stables tous emplois confondus, tandis que les liens font apparatre les donnes quelle partage - ou celles qui en diffrent - avec les autres units auxquelles elle est relie au sein du graphe. La forme de ces champs permettra de (re)construire des dictionnaires bilingues ou multilingues en utilisant nimporte quelle langue prsente dans le graphe comme langue source. De mme, toute unit lexicale du graphe pourra tre slectionne comme lexie centrale de rfrence pour la visualisation du graphe. La mthodologie pour les CSMU peut tre perue comme les moyens mettre en uvre pour oprer la transformation dun ou plusieurs dictionnaire(s) bilingues, et ventuellement monolingues moyennant quelques amnagements, en graphe multilingue unique. Lajout dune nouvelle langue et de nouvelles donnes ne doit pas en principe dmultiplier le graphe mais en permettre linsertion le plus naturellement possible. Lun des objectifs finaux demeure de restituer un dictionnaire de langues coopratif pour laide la traduction partir des CSMU. Afin de construire nos champs, nous procdons de la faon suivante : Lensemble des informations pertinentes contenues dans un dictionnaire bilingue est organis dans un tableau dont le fonctionnement a dj t dcrit et sera dtaill plus loin. Les donnes contenues dans ce tableau sont extraites conformment lalgorithme de construction des CSMU (seconde partie de ce chapitre), chaque ligne crant un ou plusieurs lien(s), chaque colonne correspondant une tiquette de mot ou une information linguistique portant sur un mot de la mme ligne.

195

lheure o nous imprimons, le programme a t crit et le passage de la base de donnes au graphe est acquise.
231

1.3.2 Prparation dune entre


Afin de prparer limplantation des CSMU partir dun dictionnaire de langues, nous allons rappeler lextrait dentre suivant que nous avons dtaill au chapitre II (Robert & Collins 2002) et qui fait apparatre les principaux traits disponibles dans notre ouvrage de rfrence, en prcisant pour chacun de ces traits ce que nous comptons en faire dans les CSMU :
leave196 /li:v/197 (vb198 : prt, ptp left199) 201 204 VT a (= go away from202) [+ town203] quitter , partir 205 206 de ; (permanently ) quitter ; [+ room, building207]
200

Entre lexicale, le mot qui est traduit. Premire colonne du tableau intermdiaire. Forme phontique de lentre lexicale. Critre non utilis. 198 Catgorie grammaticale de lentre lexicale. Doit apparatre dans un graphe complet mais napparat pas dans nos donnes car seuls les verbes y figurent, la valeur par dfaut tant donc V . Toutefois, il peut arriver quun verbe soit traduit par une unit lexicale dune autre catgorie grammaticale, et vice-versa. Dans ce cas, la catgorie dviante est mentionne. 199 Formes conjugues particulires de lentre, en loccurrence le prtrit et le participe pass dun verbe anglais irrgulier. Critre non utilis pour la construction du graphe mais quil serait ncessaire dimplanter en contre-champ pour une ventuelle application des CSMU des corpus (lemmatiseur). 200 Indicateur de transitivit. Ce trait nest pas reproduit tel quel dans notre base : la prsence de collocations objet y indique que lon traite une forme transitive (avec une distinction entre la transitivit directe et indirecte, la bitransitivit cumulant les deux, la bitransitivit directe et la bitransitivit indirecte), leur absence dnote les formes intransitives. 201 Numrotation propre au dictionnaire pour dgrouper les paradigmes de traduction en fonction des acceptions de lentre. Assimilable au dgroupement polysmique ou homonymique selon le cas. Pas utilis dans notre base. 202 Mot quivalent en langue-source de lentre dans un contexte linguistique donn. Apparat dans la colonne synonyme LangueSource gnrateur dun lien de synonymie entre ce terme et lentre. 203 Collocation objet exprim dans la langue du mot vedette. Apparat dans une des colonnes collocations objet ; il est commun lentre et au mot traduit, bien que seulement exprim dans la langue source. 204 Traduction de la vedette. Apparat dans la colonne mot-cible 205 Prsence dau moins deux traductions en langue cible de la vedette dans des contextes linguistiques quivalents. Dans ce cas, une ou plusieurs nouvelles lignes (une pour un seul mot nouveau, cinq pour deux mots, etc.) sont cres et les mots-cibles considrs sont placs dans la colonne synonyme LangueCible . 206 Information complmentaire dordre smantique portant sur la vedette et ayant une influence sur la traduction (le mot cible tant de son ct porteur de linformation leave permanently = quitter). Prsent dans la colonne infos complmentaires , catgorie ventuelle partie du discours. Ce critre peut ne concerner quune seule des deux langues compares, lautre lexie pouvant contenir implicitement cette information.
197

196

232

sortir de, quitter ;208 [+ person, job, ones husband, wife] quitter ; [+ ones children] abandonner he left Paris in 2001209 il a quitt Paris en 2001210 we left Paris at 6 oclock nous sommes partis de Paris or nous avons quitt Paris 6 heures e (Math211) three from six ~s212 three six moins trois galent213 trois f (in will) [+ money] laisser {to 214} ; [+ object, 215 property] laisser, lguer {to } 216 VI (= go away) [person, train, ship etc] partir, sen aller ; (= resign) partir, dmissionner to ~ for Paris [person, train] partir pour217
Prsence dau moins deux collocations objet distinctes pour un mme paradigme de traductions. Ces collocations sont elles-mmes des classes (et non des fragments de discours littral) induisant des paradigmes lexicaux sous-jacents. Pour linstant, il ny a quune ligne par ensemble de collocations dans le tableau. 208 Le point-virgule indique quon passe un autre contexte langagier. Dont acte sans consquence pour nos bases. 209 Syntagme exemple. Trs important car il peut faire apparatre dautres traductions, dautres collocations, de nouvelles constructions et dautres liens de synonymie LangueSource ou LangueCible que ceux proposs prcdemment. Leur analyse oblige un travail de fourmi fastidieux mais ncessaire dans un souci dexhaustivit. 210 Traduction du syntagme exemple. Voir point prcdent. 211 Indicateur de domaine demploi : typographie presque identique aux infos complmentaires lexception de la majuscule initiale. Prsent dans la colonne registre qui inclut le niveau de langue, le domaine demploi et ventuellement la zone gographique. 212 Le tilde ~ sert remplacer la graphie littrale du mot source. Sans effet notable, sauf si nous envisageons de travailler partir de dictionnaires lectroniques baliss. 213 Nouvelle traduction repre lintrieur de la traduction dun syntagme-exemple. lment ajout dans la colonne mot-cible , informations langagires ajoutes par ailleurs si elles sont reprables (collocs, constr, etc.) 214 Constructions syntaxiques particulires associes lacception traite : si le verbe est transitif indirect, on ne fait apparatre que la prposition prcdant lobjet, lequel est prsent juste avant. Linformation portant sur la langue source est en premier et en italique, nous le retrouvons dans notre base dans la colonne constructionLangueSource ; la construction pour la langue cible est en second en criture normale, cod chez nous en colonne construction LangueCible . 215 La construction en langue cible de cet exemple concerne les deux verbes candidats proposs, ici laisser et lguer. 216 Collocations sujet ou restriction sur la slection smantique du sujet pour des emplois donns. Prsent dans la colonne collocations sujet . Comme pour les objets, linformation est commune aux deux langues bien quil ne soit exprim quen langue source. 217 Construction syntaxique particulire non prvue dans le paradigme de traductions principal. A reprer et ajouter le cas chant dans les colonnes construction , si
233
207

Paris ; [ship] partir or appareiller218 pour Paris leave off219 VI (*220 = stop) sarrter where did we ~ off? (in work, reading221) o nous sommesnous arrts? ~ off ! arrte !, a suffit ! * VT SEP a (*= stop) arrter (doing sth de faire qch) leave out VT SEP a (= omit) (accidentally) oublier, omettre ; (deliberately) exclure ; [+ line in text] (also Mus)223 [+ note] sauter
222

lon considre quil sagit dune forme syntaxique pertinente (i.e. frquente et/ou complment, par opposition aux circonstants). 218 Nouvelle traduction non prsente demble et mise au mme niveau quun autre terme-cible dans les syntagmes exemples. Ajout dans les colonnes mot-cible et synonyme LangueCible , mais sur des lignes diffrentes, bien entendu. 219 Verbe particule. Pour de nombreux verbes anglais, ces formes sont des lexies part entire et nous souhaitons les traiter comme telles au sein du graphe. Dans ce cas leave off fait lobjet dun traitement diffrenci par rapport leave en devenant un mot-source . 220 le * sert signaler un emploi familier, en loccurrence celui de leave off avec le sens de sarrter. Plus le nombre dtoiles est lev, plus lexpression est considr comme grossire. Peut faire lobjet dune colonne part, non rserve pour linstant, ou bien tre cod dans la colonne registre. 221 Information pragmatique sur le contexte langagier, mme typographie que les domaines demploi ou les informations complmentaires de type adverbiales. On suppose quil peut tre implicite aussi bien quexplicite selon les circonstances. Utile lorsque le contexte dnonciation peut permettre de distinguer deux acceptions. Prsent dans la colonne informations complmentaires . 222 SEP indique que le verbe et la prposition sont sparables dans certaines constructions du verbe particule considr. Lorsque le verbe et la prposition ne sont pas sparables, le dictionnaire le mentionne par FUS (comme fusionn). Critre non rpertori mais important, tudier. 223 also est prsent pour prciser que la traduction gnrique propose sapplique galement un domaine spcifique, en loccurrence la musique. Dans ce cas, deux lignes de tableau sont ncessaires pour distinguer les collocations alors que la traduction reste la mme, car nous ne fusionnons pas demble les donnes demplois diffrents.
234

1.3.3 Rcapitulation des traits utiles


De tous les lments prsents ci-dessus, nous ne retenons pour la construction de notre base que ceux de la liste suivante (nous excluons de cette liste les lments jugs non pertinents pour notre tude (phontique, etc.) et ceux que nous gardons pour plus tard). En dehors de la catgorie grammaticale, aucun de ces lments nest obligatoire, pas mme le premier (dans le cas dune locution intraduisible) : la vedette, le mot en entre : mot source ; une ou plusieurs traductions en langue cible pour chaque acception et/ou chaque contexte donn(e(s)) : mot cible et synonymelanguecible (synLC) (pour un nombre de traductmes 2) ; des marqueurs demploi pour les vedettes et les candidats (registre de langue, technolecte, idiolecte, rgionalisme, zone demploi gographique) : registre ; les catgories grammaticales des vedettes et des traductions (pouvant tre diffrentes) : V (verbe) par dfaut. Toutefois, certains adverbes ou noms dverbaux peuvent traduire des verbes dans des contextes particuliers, do lobligation de mentionner la catgorie pour tous les mots ; des synonymes de la vedette en langue source pour une acception et/ou un contexte donn(s) : synonymelanguesource (synLS) ; les constructions syntaxiques associes la vedette et au(x) candidat(s) : constrLS et constrLC ; des informations pragmatiques ou des modifieurs qui affinent le contexte d emploi : infos complmentaires ; des syntagmes exemples traduits qui illustrent un emploi donn, et qui le cas chant font apparatre des traductions et/ou des constructions syntaxiques nouvelles : mot cible, synonymelanguecible, constructionLS, constructionLC, collocations objet, collocations sujet voire registre et infos complmentaires ; les syntagmes exemples sont une vritable mine dinformations nouvelles ; des collocations sujet ou objet habituellement associes aux vedettes et candidats prsents : collocations objet1 et 2, collocations sujet.
235

1.3.4 Visualisation des critres retenus et de la base daccueil


Figure 31 : mise en forme du fragment d'entre "to leave"
mot- mot-cible source Syn LS syn LC colloc objet colloc sujet constr LS constr LC registre infos complmentaires

Aleave Fabandonner Aleave Fappareiller Aleave Fdmissionner Aleave Fgaler Aleave Flaisser Aleave Flaisser Aleave Flguer Aleave Fpartir Aleave Fpartir Aleave Fpartir Aleave Fpartir Aleave Fpartir de Aleave Fquitter Aleave Fquitter Aleave Fquitter Aleave Fquitter Aleave Fs'en aller Aleave Fsortir de Aleave off Aleave off Aleave off Aleave off Aleave off Aleave out Aleave out Aleave out Aleave out Aleave out Aleave out Farrter Farrter Fs'arrter Fsuffire Fs'arrter Fexclure Fomettre Foublier Fsauter Fsauter Ftenir l'cart omit omit omit oublier omettre stop stop arrter go away partir go away from quitter go away from partir de go away from go away from sortir de go away resign lguer laisser s'en aller dmissionner appareiller Resign partir partir

children ship numbers money object, property object, property person, train, ship, etc ship person, train town town permanently room, building person, job, husband, wife person, train, ship, etc room, building go away from quitter suffire vb ing de vb inf for obj for obj pour obj pour obj to obj to obj to obj obj obj obj for obj pour obj math in will in will in will

a in work, reading deliberately accidentally accidentally line in text note mus

laisser l'cart sb

Chaque ligne du tableau reprsente les informations lies une et une seule traduction dune unit donne, i.e. lintersection dun contexte demploi et dun seul candidat, celui-ci tant ventuellement accompagn dune autre traduction potentielle
236

contexte quivalent. Dans ce dernier cas cependant, une autre ligne sera ncessaire pour mettre en avant le second candidat. Certaines colonnes nouvellement cres ne figurent pas encore dans cette reprsentation : la langue, dsormais spare des lexies dans loptique dun traitement automatique, la sparation entre collocations objet1 pour les emplois transitifs directs et collocations objet2 pour les indirects, la colonne argumentcompl qui doit rendre compte du nombre darguments non sujets dans lemploi vis. Cette dernire est prvue sous rserve de faisabilit puisque la dtermination du degr de transitivit224 de chaque lexie est une tche ardue. Ceci nexclut pas la possibilit de lajouter ultrieurement (mme de manire parcellaire au cas par cas) car nous proposons des modles volutifs susceptibles dtre paramtrs au-del de leurs possibilits initiales. Les quatre premires colonnes de la base de donnes correspondent des units lexicales visualisables dans les CSMU et ne faisant pas partie des structures de traits (cf. algorithme) : 1 Mot-source : cest le terme-noyau, celui qui est traduit 2 Mot-cible : traduction directe du mot-source 3 Synonyme LS : terme prsent dans le dictionnaire comme synonyme direct du mot-source vis--vis du mot-cible 4 Synonyme LC : terme propos comme traduction directe du motsource au mme niveau que le mot-cible de la mme ligne. Le synonyme LC devient mot-cible son tour dans la base avec le mme paradigme dinformations extralexicales. Les six dernires colonnes contiennent les informations argumentales, syntaxiques et pragmatiques qui sont exprimes dans le dictionnaire et qui renseignent les liens lexicaux prcdemment dcrits, futurs constituants des structures de traits susmentionnes : 5 Collocation objet 6 Collocation sujet 7 Construction LS 8 Construction LC
224

Autrement dit de la valence.


237

9 Registre 10 Informations complmentaires Il conviendra dajouter ces six catgories informationnelles celles que nous voquons plus haut (langue, bitransitivit). Dautre part, nous craignons que la constitution des deux dernires colonnes en catgories fourre-tout ne soit sans doute pas satisfaisante dans une analyse complte et srieuse des phnomnes de synonymie interlangue.

1.4 Construction des bases de donnes 1.4.1 Mthodologie dextraction des donnes
Pour constituer nos paradigmes de traduction, nous employons une mthode dextraction lexicographique en trois tapes, au moins : Lextraction directe, aussi appele traduction droite , qui rcupre toutes les traductions du mot-source lentre de celui-ci dans le dictionnaire bilingue. Lextraction cache , ou traduction inverse , qui ajoute la prcdente toutes les units lexicales dont le mot tudi est une traduction propose mais qui napparat pas dans les traductions droites (cf. Ploux, 1997 pour une semblable mthodologie partir de dictionnaires de synonymes). Les cas de redondance avec les rsultats de la premire extraction ne constituent pas un problme mais plutt un complment dinformations. Pour les bases des CSMU comme pour les Lexiques Inverss, cest le mme principe du miroir qui sapplique. Lextraction indirecte qui ncessite au moins deux tapes dinvestigation. Dans notre terminologie, une traduction indirecte dun mot-source est soit la traduction directe ou cache dun de ses synonymes directs, soit un synonyme direct dune de ses traductions directes ou caches. Les deux premires sont manuelles et respectent littralement la cohrence de louvrage lexicographique choisi, nonobstant les corrections manuelles que nous pouvons tre amens effectuer en cas derreur ddition. La troisime est souhaite comme laboutissement ou le prolongement du travail de modlisation que nous avons effectu.
238

1.4.2 Premire tape de formalisation


Pour reprsenter les rsultats de lextraction de faon plus formelle, voici comment nous procdons : Tout verbe Vi de la base a un nombre n de traductions directes. Chacune de ces traductions (V1 Vj) a un nombre n de traductions directes dans la langue de Vi (ensemble dont celui-ci peut tre exclu, cf. les lexiques inverss et leur dissymtrie225). Chacune des traductions des traductions de Vi a un nombre n de traductions Ainsi de suite. Pour des raisons videntes de non-redondance des informations saisies, on ne balaie pas deux fois partir de la mme lexie. Par cette mthode, on construit un graphe lexico-smantique multilingue morceau par morceau. Chaque lien du graphe est un lien objectif, i.e. purement lexicographique.

1.4.3 propos de la sphre dinfluence et des tiquettes des lexies


Le balayage na pas de fin, les limites de la sphre dinfluence du verbenoyau sont rapidement atteintes puis franchies ; sans restriction, un seul parcours par balayage peut couvrir lensemble des verbes des deux langues compares. Si le champ synonymique du verbe-noyau est contraint pralablement au balayage, lcueil peut tre surmont (do le choix du paradigme de synonymes du noyau). Dans ce cadre, nimporte quel lexme peut devenir le verbe-noyau, selon langle de vue du concepteur ou de lobservateur. Nanmoins, le changement du verbe de rfrence modifie la forme du sous-graphe considr, car chaque verbe a son propre paradigme de synonymes dans sa langue, trs probablement diffrent de celui du verbe-noyau prcdent. Il faut ajouter que les informations concernant les registres demploi, les constructions syntaxiques et les collocations sont associes aux liens entre deux lexies

Par exemple, abandonner est une traduction directe de to jettison mais ce dernier nest pas une traduction directe de abandonner.
239

225

et non pas aux tiquettes lexicales, tant entendu que ces donnes diffrent souvent dun contexte lautre pour un lexme226 donn.

2. Sur la notion de synonymie 2.1 Prliminaires


Dans la mesure o nous prtendons construire un graphe de synonymes multilingue , il est ncessaire de revenir sur la notion de synonymie et sur le sens que nous entendons lui donner. La dfinition habituelle de la synonymie est : relation entre deux mots ou deux expressions qui ont des significations trs voisines ou le mme sens . Il sagit dune relation mathmatiquement non oriente car la synonymie marche toujours dans les deux sens, i.e. si le terme a est synonyme du terme b alors le terme b est synonyme du terme a : [(aSb => bSa) ^ (bSa => aSb)]227 Pour notre vision de la synonymie, il est ncessaire de prendre en considration deux paramtres : la polysmie quasi systmatique de la plupart des mots et expressions, ce qui implique que la synonymie ne sapplique pas vritablement (ou trs rarement) des units lexicales mais plutt des entres lexicales (sous forme de lexies) de chacune dentre elles ; linfluence du contexte langagier. La synonymie que nous envisageons est une synonymie en contexte, une mme entre lexicale en langue source pouvant tre traduite de diffrentes manires selon le contexte dnonciation. Nous avons remarqu la prdominance du contexte et surtout de sa partie co-textuelle dans les occurrences que nous avons analyses partir de FRANTEXT. Les liens de synonymie issus des dictionnaires de langues sont orients de facto et nous ne masquerons pas demble les orientations car les liens orients nous donnent des informations importantes sur la faon dont les dictionnaires sont conus
226

Notons que nous employons toujours lexie dans le sens dun emploi donn dun mot prcis par Meluk la suite de Pottier, et que nous utilisons terme ou entre lexicale pour dsigner un verbe (ou un mot de faon gnrale) tous emplois confondus. 227 O a et b sont des variables et S est le lien de synonymie formalis. Relation dimplication entre deux synonymes.
240

ainsi que sur la dissymtrie de traitement et de fonctionnement de la traduction, voire sur la structure conceptuelle mme des langues mises en relation. Ce parti pris se retrouve dans le graphe final, bien quil soit trs facile de transformer un graphe orient en un graphe non orient, en modifiant simplement lalgorithme de mise en relation des lexies. En outre, nous considrons galement la synonymie comme un phnomne interlangue en partant du principe que la traduction respecte le principe de base de la synonymie, savoir que le traductme et le terme en langue-source ont des significations trs voisines ou le mme sens . Pour aller plus loin dans notre propos, il parat vident que le lien de synonymie est plus fort entre la lexie et ses traductmes quentre deux termes de mme langue, selon le principe dconomie du langage qui engendre peu de doublons systmatiquement substituables lun lautre tous contextes confondus dans une langue donne. Nos travaux de dpouillement de donnes font merger diffrents niveaux de synonymie en fonction du statut des lexies derrire lentre vedette. Si la traduction idale est le niveau de synonymie le plus vident et le plus immdiat, la plupart des paradigmes de traduction ne sont pas conus de faon homogne et strictement bijective : tel contexte entranera lmergence de plusieurs candidats et, a contrario, tel candidat pourra tre prsent comme la traduction potentielle dun mot de langue identique lentre tout en ntant pas lentre.

2.2 Les niveaux de synonymie 2.2.1 Notion de lien


La forme des dictionnaires sur lesquels nous avons travaill a conduit la distinction entre plusieurs types de synonymie (nous vitons de dire niveau pour ne pas tablir - pour linstant - de hirarchie dans la valeur des liens choisis). Les quatre premiers sont des liens directement accessibles, i.e. visibles pour le lecteur lors dune consultation simple dans le(s) dictionnaire(s) ainsi que dans le tableau de donnes. Nous entendons par lien la fois une relation de synonymie et/ou de traduction au sens linguistique (en loccurrence lexicographique), ainsi quune relation univoque ou biunivoque au sens mathmatique, celle-ci marque par des liens orients ou non au sein dun graphe implantable. Les relations linguistiques sont ainsi formalises mathmatiquement dans un algorithme destin la programmation. Lexpression la plus prosaque du lien sera par consquent un arc de graphe orient, et les objets relis des sommets. Par ailleurs, les liens que nous prsentons dans notre algorithme ne sont pas tous issus de lobservation dun seul et mme ouvrage lexicographique. Il convient ici de distinguer la synonymie sans lien avec la traduction (pour la dlimitation du souschamp smantique de la lexie noyau en langue source) de la synonymie observe dans notre dictionnaire de rfrence. Pour cette dernire, plusieurs types de liens de
241

synonymie diffrents ont t relevs : des liens de traduction directe ou indirecte qui raccorde des lexies de langues diffrentes, et des liens de synonymie via la traduction qui mettent en relation des lexies de la mme langue (source ou cible selon les cas). Pour caractriser les liens que nous allons dfinir, des rponses doivent tre apportes aux trois questions suivantes : quest-ce qui tablit chaque type de synonymie, est-ce que la langue est la mme pour les deux lexies, larc est-il orient ?

2.2.2 Les liens synonymiques


2.2.2.1 Liens synonymiques sans lien avec la traduction : synonymie directe (SD) Il sagit du lien de synonymie par les synonymes et quasi-synonymes en langue source. Cest le seul lien qui nest pas interprt partir des dictionnaires de langues ; il sagit de liens de synonymie rpertoris dans des dictionnaires de synonymes monolingues. Leur utilisation nous permet de visualiser des sous-graphes partir dune ou plusieurs lexies de rfrence (ou lexie-noyau) en rglant le problme des limites du champ. Ce lien est orient pour les mmes raisons que le suivant, en ce qui concerne les dictionnaires de synonymes. a SD b ssi : b est synonyme de a dans le paradigme des synonymes et quasisynonymes de a ; Langue a = Langue b ; arc orient de a vers b. 2.2.2.2 Liens Synonymiques De Traduction
2.2.2.2.1 Liens reprables en premire lecture

2.2.2.2.1.1 Synonymie de Traduction (ST)

Cest le lien de traduction directe correspondant la note 1 de lentre et aux deux premires colonnes de notre tableau : il y a ST lorsquun terme est propos comme candidat de traduction pour une vedette donne. Le lien est orient car il ny a pas forcment symtrie entre les deux parties dun mme dictionnaire bilingue (cf. une nouvelle fois le commentaire sur les Lexiques Inverss).

242

a ST b ssi : b traduit a Langue a Langue b Arc orient de a vers b


2.2.2.2.1.2 Synonymie Partielle de Traduction en langue Cible (SPTC)

Le SPTC est un lien de synonymie entre deux lexies de langue identique qui traduisent le mme terme de la langue source dans des contextes quivalents (note 10 de lentre-exemple, deuxime et quatrime colonnes de notre tableau). La prsence dau moins deux traductions dune entre lexicale contextes quivalents conduit tablir une connexion forte entre deux entres lexicales de deux lexmes diffrentes en langue cible. Ce lien est non orient car le dictionnaire ntablit aucune hirarchie ni aucune comparaison discriminatoire entre les deux termes par rapport la lexie dorigine. On peut donc en dduire que les deux traductions sont interchangeables, en principe. a SPTC b et b SPTC a ssi : a et b traduisent c contexte quivalent, (contexte(a) = contexte(b)) contexte(c)228 (Langue a = Langue b) Langue c Arc non orient
2.2.2.2.1.3 Synonymie Partielle en langue Source (SPS)

Le SPS est le lien de synonymie entre la lexie traduire et un autre mot de la langue source propos comme quivalent dans un contexte donn, en rapport avec un ou plusieurs mot(s) en langue cible traduisant la premire (note 7 de lentre-exemple, premire et troisime colonnes du tableau). Le lien est orient car il ny a pas l non plus de symtrie systmatique entre les deux parties du dictionnaire.

contexte(a) est comprendre comme le contexte dans lequel le mot dsign par la variable a est employ .
243

228

a SPS b ssi : c ST b et a est propos comme quivalent b dans le contexte de traduction qui mne c, (contexte(a) = contexte(b)) contexte(c) (Langue a = Langue b) Langue c Arc orient de b vers a
2.2.2.2.2 Liens indirects de synonymie

Les niveaux suivants ncessitent la mise en place dau moins une rgle dextraction intermdiaire entre le dictionnaire et le tableau dun ct, et le graphe de lautre.
2.2.2.2.2.1 Synonymie indirecte (SI)

Le SI est un lien de synonymie entre lquivalent SPS de la vedette traduire et la lexie qui traduit cette dernire (deuxime et troisime colonnes du tableau). Le lien SI est orient car il nexiste pas de symtrie observable pour ce cas. Toutefois, la mme synonymie indirecte peut tre observe en sens inverse, il y aurait donc dans ce cas neutralisation de lorientation du lien. a SI b ssi : a SPS c et b ST c (Langue a = Langue c) Langue b Arc orient de a vers b
2.2.2.2.2.2 Synonymie absolue (SA)

Nous employons le terme de synonymie absolue pour dnoter un double lien de traduction directe entre deux lexies. Autrement dit, il y a lien non orient SA entre deux mots de langues diffrentes ds lors que le premier est propos comme traduction directe du second et vice-versa. De mme, tous les autres liens orients de la premire liste peuvent tre renforcs en cas de symtrie.

244

a SA b ssi : a ST b et b ST a Langue a Langue b Arc Non Orient

2.2.3 Prformalisation des liens de synonymie, rinterprtation


En rsum notre pr-algorithme (non encore implantable) se prsente de la faon suivante :
Soit deux mots M1 et M2,

M1 est synonyme direct de M2 si : M2 traduit M1, Langue M1 (LM1) Langue M2 (LM2). Ex : to leave(English (E)) traduit abandonner(Franais (F)) ou M1 traduit M2, LM1 LM2 ou M1 et M2 sont synonymes lexicographiques en langue source, LM1 = LM2 M1 est synonyme partiel de M2 si : M1 et M2 traduisent le mme mot dans des conditions demploi analogues, LM1 = LM2. Ex : quitter(F) et partir de(F) traduisent to leave(E) ou M1 et M2 sont traduits par le mme mot dans des conditions demploi analogues, LM1 = LM2. ex : to leave(E) traduit quitter(F) et partir de(F) M1 est synonyme absolu de M2 si : M2 traduit M1 et M1 traduit M2, LM1 LM2. ex : abandonner(F) traduit to leave(E) et to leave(E) traduit abandonner(F) ou M1 et M2 traduisent le mme mot et sont tous deux traduits par le mot en question dans des conditions demploi analogues, LM1 = LM2.
245

ex : quitter(F) et partir de(F) traduisent to leave(E) ET to leave(E) traduit quitter(F) et partir de(F) M1 est synonyme indirect de M2 : Chaque fois quils font partie du mme champ synonymique sans lien direct ou absolu. Exemples : abandonner(F) traduit to leave et quitter traduit to leave. Autre cas de figure, Abandonner(F) traduit to leave et to leave traduit quitter. Dans ces deux cas, quitter et abandonner possdent un lien de synonymie indirecte via to leave. Les liens de synonymie indirecte ncessitent llaboration dune solide mthodologie complmentaire pour tre correctement distingus les uns des autres.

3. Recensement des variables et lecture du tableau


La liste ci-dessous rsume en les explicitant toutes les donnes prsentes dans notre base synthtique. Le cas chant, nous tentons de porter un regard sur une possible ontologie des lments de chaque catgorie vue dans sa totalit.

3.1 tiquettes de mot


Les tiquettes de mot concernent tous les verbes et toutes les priphrases verbales de chaque langue insrer dans le graphe. Dans la mesure du possible, nous souhaitons implanter une seule tiquette par unit lexicale, mme en cas de forte polysmie de celle-ci. Les priphrases verbales figes ainsi que les verbes particule sont considrs comme des lexmes part entire dans notre tude. Cette variable est valable pour motcible, motsource, synonymemotsource et synonymemotcible, lesquels renvoient dans le tableau des objets de type Mot. Lontologie de cette catgorie est quivalente une nomenclature exhaustive des verbes de chaque langue en y incluant les priphrases les plus smantiquement pleines.

3.2 Liens de synonymie


En complment aux niveaux de synonymie dcrits dans le chapitre prcdent, nous noterons que tout lien implant concerne des lexies prsentes dans la mme ligne du tableau de donnes. Toutefois, des liens indirects peuvent merger partir du graphe. Lensemble des liens de synonymie rpertoris a dj t dcrit dans ce chapitre.

246

3.3 Synonymes et quasi-synonymes


Les synonymes et quasi-synonymes sont extractibles pour chaque lexme vis, leur paradigme est restreint et born. Afin de ne pas construire dans le flou les listes de synonymes et quasi-synonymes de chaque verbe, nous proposons dutiliser, pour le franais, les donnes fournies par la fusion des dictionnaires de synonymes ralise lINALF et exploite Caen (Jacques Franois et son quipe) et Lyon (Sabine Ploux). Lors de lextraction de nos donnes bilingues par balayage, nous ne balayons plus ds lors que nous rencontrons une lexie nappartenant pas ce paradigme. Pour langlais, nous envisageons dutiliser les paradigmes de composantes connexes anglaises utiliss par Sabine Ploux en relation avec les paradigmes en langue franaise. Aucune solution dfinitive nest slectionne pour les autres langues pressenties puisque nous ne connaissons pas de travaux quivalents ceux que nous venons dvoquer en espagnol ou en italien. Nous voyons le rseau final comme une grande sphre lintrieur de laquelle sinterconnectent autant de sphres-bulles quil y a dunits lexicales, toutes langues confondues. Chacune de ces bulles a comme noyau central un lexme qui possde sa sphre dinfluence sur tous les autres termes de ladite bulle. Cette vision est purement lexico-conceptuelle et soppose de facto une modlisation sous la forme de traits aspectuels et vnementiels. Toutefois, il ny a pas de relle incompatibilit entre les deux visions, celle qui nous est propre se rapproche de la volont de Bruno Gaume (IRIT, Toulouse) de mettre des artistes contribution pour transformer ses modlisations lexicales en uvres artistiques.

3.4 Collocations sujet


La constitution dune ontologie est probablement ncessaire, partir du dictionnaire ou dans labsolu (utilisation dontologies dj existantes) pour dgager des classes de collocations, de la mme faon que le dictionnaire, lequel ne propose pas des nomenclatures de collocations mais exclusivement des tiquettes de classes (e.g. vhicule) ou des objets prototypiques (ex : voiture, camion, bicyclette). Dans la mesure o notre recueil de donnes relve de la synthse dinformations lexicographiques, nous envisageons de conserver telles quelles les donnes prsentes dans les dictionnaires. Dtail important, les collocations sujet mentionnes concernent presque exclusivement les verbes signals comme intransitifs. De ce fait, la pertinence smantique du sujet semble tre ignore par les rdacteurs pour les verbes intransitifs, comme si la prsence dun objet suffisait slectionner le candidat appropri, ce qui correspond assez peu la ralit de la langue.

247

3.5 Collocations objet 3.5.1 Ontologiquement parlant


La situation des collocations objets est la mme que celle des sujets concernant la constitution ventuelle dune ontologie, ceci prs que les collocations objet ne sont proposes que pour les verbes signals comme transitifs. Ceci implique la caractrisation de la transitivit par lobjet et celle de lintransitivit par le sujet, ce qui peut surprendre premire vue mais sexplique probablement en raison de la trop grande diversit des arguments sujets potentiels pour la plupart des lexies.

3.5.2 Structure argumentale : Gnralits et lexicographie


En ralit, ltude systmatique de la structure argumentale des prdicats montre que la saturation complte des traits smantiques et aspectuels de ceux-ci repose sur une connaissance globale de tous les lments qui composent leur co-texte. De ce point de vue, les dictionnaires de langues que nous utilisons prsentent une lacune importante pour le passage une modlisation prcise. Pour le verbe traverser, par exemple, il peut y avoir conflit entre les traductions proposes pour la collocation sujet [projectile] et celles proposes pour la collocation objet [pont], car les deux ensembles sont fonds sur des donnes stochastiques et prototypiques et ne distinguent pas des occurrences de ce type : 1) Lobus a travers le mur 2) Le passant a travers le pont 3) Lobus a travers le pont La troisime phrase est ininterprtable du point de vue du dictionnaire, car les traductions quelle induit sont contradictoires, selon quon pointe sur le pont comme difice reprsentatif ou sur lobus en tant que projectile. Comme nous le montrons dans le troisime chapitre, les donnes lexicographiques restreignent les conditions demploi de chaque lexie en fonction de critres gnriques non gnralisables. Dans lexemple de lobus qui traverse le pont, il y a prminence de la transperce (par lobus) sur la traverse standard du pont, ce dernier tant vu en tant que parcours. Si lutilisateur peut dans la plupart des cas effectuer cette infrence, cela nest absolument pas transparent ni formalisable dans notre algorithme.

3.5.3 Sparation des Collocations Objet


Le second problme pos par les collocations objet rside dans la bivalence ou la trivalence de certains prdicats. La prsence de deux complments obligatoires (ou attendus) implique une duplication des collocations objet dans le tableau de donnes, moins de faire apparatre une mme traduction sur deux lignes successives, solution
248

peu efficace notre avis. Par consquent, nous y avons ajout une colonne collocobj2 en complment de la collocobj1. Par souci de cohrence, les deux paradigmes collocationnels ne doivent pas contenir le mme type de donnes. Nous allons montrer leurs diffrences laide des exemples ci-dessous : 4) 5) 6) 7) Pierre parle de Paul Marie = Pierre parle Marie de Paul John is giving a book to Mary =John is giving Mary a book

Plusieurs constats syntaxiques sont prendre en compte pour la comparaison entre franais et anglais. Tout dabord, lordre des complments non pronominaux est souvent libre en franais (4 et 5), alors que cette inversion nest pas possible en anglais moins dun changement de structure infra-syntagmatique (6 et 7). Ensuite, le franais ne permet jamais la prsence de deux complments syntagmes nominaux (SN) derrire le mme prdicat verbal ; le cas des circonstants SN tels que lan dernier nentrant pas dans le calcul de la valence verbale. Ainsi, *donner Marie un livre ou *donner un livre Marie est un modle impossible reproduire depuis langlais et donner un livre lan dernier fonctionne mais nest donc pas prendre en compte. Enfin, la prsence dau moins deux complments dans la porte dun seul prdicat implique de les discriminer en termes de rles argumentatifs, lesquels serviront de critres pertinents pour la caractrisation de collocobj1 et 2. Tout ceci nous montre la forte interaction entre les donnes collocationnelles et les donnes structurales. Aussi, le tableau comme lalgorithme devront la faire apparatre en mentionnant le type dobjet vis pour chaque construction propose.

3.6 Constructions syntaxiques indirectes


Dans notre tableau de donnes, mention est faite des constructions propres chaque langue pour les transitifs indirects. Leur liste exhaustive est en apparence assez facile constituer en raison du nombre limit de prpositions et conjonctions, et du nombre galement limit de constructions qui les suivent (propositions compltes, syntagmes nominaux, groupe infinitif, etc. Voir en annexe).

249

3.7 Indices non langagiers 3.7.1 Registres et domaines


Leur ontologie est restreinte et relativement facile constituer si lon respecte une distinction rigoureuse entre les diffrents registres rpertoris. En effet, il convient de faire deux distinctions : Il ne faut pas confondre rgionalisme, niveau de langue et domaine demploi, bien que ces informations soient typographiquement peu diffrencies dans les ouvrages. Certains registres affichs peuvent tre subsums par dautres. Rien ne distingue premire vue le domaine sport de rugby, cet exemple dmontrant la ncessit probable de recourir une ontologie hirarchise en ce domaine.

3.7.2 Informations complmentaires


Cet ensemble est galement trs dlicat rpertorier, les informations ntant pas toujours trs homognes. En particulier, il convient de faire la diffrence entre les donnes lies au contexte langagier et celles qui ne se rapportent qu la situation dnonciation, voire ltat desprit du locuteur. Les premires sont souvent des adverbes (pas ncessairement exprims dans le discours et gnralement valables ou pertinents pour une seule des deux langues mises en correspondance) et les seconds brassent beaucoup plus large. Nanmoins, la prsence de ces informations demeure marginale dans lensemble du dictionnaire, ce qui nen fait pas pour autant des lments ngligeables. Lobservation doccurrences sur corpus montre que ces informations complmentaires sont souvent propres un emploi du verbe en contexte mais ne prsume pas de lopportunit de sa gnralisation dans les dictionnaires, ce qui fait de ses informations des traits prototypiques avant tout.

4. Unification des contextes 4.1 Pourquoi unifier


Pour dterminer la validit des liens de synonymie absolue et de synonymie indirecte (SA et SI), il faut procder un examen de compatibilit des contextes (comprendre : structure contenant les informations sur les collocations, les constructions syntaxiques et le(s) registre(s) et domaine(s) demploi ) et en raliser la fusion ou dfaut- la runion.
250

4.2 Comment unifier 4.2.1 Mthode


Deux contextes seront considrs comme compatibles sils sont identiques ou si lun subsume lautre. Pour tous les autres cas, il y a doute et besoin de vrifier la relle non-compatibilit (notamment pour la synonymie absolue (SA), laquelle devrait dcouler dune fusion systmatique des contextes par souci de cohrence, mais est-ce toujours bien le cas ?). Lunification des constructions syntaxiques ne doit pas tre un problme : les emplois intransitifs et/ou transitifs directs sont explicitement mentionns dans les deux langues, ainsi que les constructions syntaxiques particulires en cas de prsence dun objet indirect ou dune compltive (infinitive ou phrastique). Sur ce point comme sur les autres, il ny a gure de symtrie interlangue ; lunification doit respecter le principe selon lequel une construction syntaxique ne se calque pas littralement dune langue sur lautre.

4.2.2 Polmique sur le sens et la forme


Cette dernire rflexion en appelle une autre : la question de la prminence de la syntaxe sur la smantique, et/ou vice-versa. De notre point de vue, la question ne peut se poser en ces termes. La syntaxe est ce qui est le plus directement perceptible dans le langage reu (i.e. par lauditeur) tandis que le sens est le matriau cognitif indfinissable qui prexiste sa mise en forme langagire (pour le locuteur). Toutefois, ceci tant pos, lun ne va pas sans lautre et inversement. Dire que la forme prexiste au sens reviendrait percevoir le langage comme une succession de structures qui prennent sens aprs leur production, de mme que prtendre que le sens prime sur la forme oblige donner un aspect explicite - et donc explicitable en termes langagiers - ce quest le premier, chose impossible raliser sans recourir au langage, ft-il mtalinguistique. Certaines thories de la philosophie du langage (Pascal, Guillaume, etc.) postulent quil ny a pas de frontire entre la pense et la parole, entre le mta-sens et son expression langagire, entre la substance et la structure. Lhomme est un tre de parole parce quil pense, et il pense car il est un tre de parole. (Pascal, 1662). Le renversement de laxiome initial sexplique difficilement dun point de vue mcanique ; pourtant, cest la mcanique que Gustave Guillaume invoque pour expliquer sa thorie psychomcanique du langage . Aussi, nous admettons que forme et sens (syntaxe et smantique) sont fortement corrls et interdpendants, et quils nentretiennent pas de relation de prminence ni de prexistence lun par rapport lautre. Cela suppose que nous nous posions le problme en termes de structure au sens informatique : quels sont les traits distinctifs dune lexie en usage, comment les reprsenter dans une structure unique et comment y avoir accs. La hirarchie des traits stablie ds lors de facto par la linarit du
251

langage : ce qui prime, cest ce qui est en tte de la structure implante, ce qui ne signifie nullement que le trait rencontr en premier subsume les autres. Il en va de mme pour les traits de registre, de domaines voire de donnes pragmatiques, qui tous participent et de la parole. Tout au plus peut-on relever certaines pistes de rflexion sur le fait que laspect fig et limit des structures dune langue conditionne le sens, mais on signale que linverse est galement vrai dans la mesure o les structures subissent la loi de la ncessit naturelle : si besoin est dexprimer quelque chose, le langage qui est loutil de cette expression fournit les matriaux de base pour enrichir le paradigme smantique. En somme, la langue fonctionne par auto-enrichissement ou tout simplement par volution naturelle.

4.2.3 Clture de la polmique et solutions pour lunification


Cette vision des choses peut videmment poser certains problmes mthodologiques dans la mesure o nous ne dgageons pas de hirarchie de traits. Au demeurant, les besoins dune hirarchie de traits ne se posent pas dans le cadre dune structure comme dfinie plus loin : une lexie se dfinit par un ensemble de traits pertinents, lesquels doivent tous tre prsents au sein de la mme structure compositionnelle (un trait non pertinent ou non prcis est tout de mme explicit en tant quensemble vide). Pour dpasser les obstacles induits par les vellits dunification de structures de traits compatibles dans les faits mais contradictoires en apparence, nous envisageons de revenir lide dunion des donnes (au sens mathmatique), au risque dintroduire dans le graphe des donnes redondantes. Procder de cette faon suppose que nous dsorientions le graphe un moment donn et surtout que nous admettions quun mot qui en traduit un autre est lui-mme traduisible par celui-ci (principe du miroir). Linguistiquement parlant, cela reste discutable et nous y reviendrons.

5. criture de l'algorithme 5.1 Choix de la procdure de mise en uvre 5.1.1 Outillage


Pour dcrire prcisment lalgorithme dimplantation du graphe, nous aurons recours aux notions et outils dobjets structurs, densembles et de fonctions. Les premiers contiennent lensemble des traits distinctifs pour une lexie donne (globalement ou en contexte), les seconds sont utiliss en guise de listes de traits ou de valeurs associes un attribut dobjet donn et les troisimes permettront lcriture de sous-programmes ncessaires la bonne implantation des liens de synonymie. Reprenons pour exemple quelques lignes de notre tableau de donnes lgrement adaptes. Nous avons choisi deux verbes pour illustrer la construction de
252

lalgorithme : to leave (A) et parler (F). Leurs caractristiques respectives, notamment argumentales, sont trs complmentaires et justifient ce choix. 5.1.1.1 Fragment de to leave
Figure 32 : seconde mise en forme dun fragment d'entre de to leave
motsource LS Motcible LC SynLS SynLC obj1 obj2 suj constrLS constrLC Registre infoscomp ls

leave leave

a a a a

laisser quitter

f f f f

lguer

object, property job, husband, wife person, train, ship, etc

obj1 | to obj2 obj1 | a obj2

in will

leave

partir

go away

sen aller

leave

partir

resign

dmissionner

Dans les classifications verbales prototypiques, to leave est plutt prsent comme un verbe de valence 1, cest--dire que sa structure prdicative attend deux arguments : le sujet et un objet direct. Toutefois, la polysmie de to leave le classe galement parmi les verbes de valence 2 (to leave sth to sby) ou de valence 0 en tant quintransitif sujet spcifique. Les trois cas de figure sont prsents dans lexemple ci-dessus. Outre la mise en exergue des constructions intransitives, transitives directes et bitransitives de ce verbe, lautre intrt de ce fragment est de prsenter une possible prsence de synLS et synLC. 5.1.1.2 Fragment de parler
Figure 33 : fragment slectionn de parler
motsource LS Motcible LC synLS SynLC obj1 obj2 suj constrLS constrLC Registre infoscomp ls

parler parler parler

f f f

speak talk tell

a a a

talk speak quelque chose quelqu un de obj1 | a about obj2 (2) obj1

facult phys facult phys pour informer

Parler prsente des caractristiques trs diffrentes des prdicats verbaux appartenant au champ de labandon. En premier lieu, il sagit dun verbe naturellement
253

intransitif (valence 0) en tant que prdicat dnotant lactivit de parole, i.e. la facult physique qui y est associe ainsi que lactivit quelle permet229. Nous avons dj largement insist sur la dichotomie de surface entre dire et parler ; aussi, nous nous contenterons de rappeler que de nombreux verbes de parole peuvent tre classs dans les deux ensembles selon leur emploi, y compris parler luimme. Les emplois que nous prsentons ci-dessous illustrent cette ambivalence : ou parler se rapporte lactivit physique, la capacit langagire et il est intransitif (deux premires lignes du tableau exemple) et se classe dans le paradigme quil chapeaute lui-mme ; ou bien parler est employ pour introduire le thme et le destinataire du contenu de parole (ligne 3), auquel cas il nest pas prototypiquement un verbe support de paroles rapportes (comme le sont les cousins de dire), mais il nen devient pas moins un verbe bitransitif dont les traits smantiques attendus (valence 0) sont sursaturs. Ce fragment est galement trs intressant du point de vue contrastif, car to tell est un verbe qui peut traduire aussi bien dire que parler, ainsi que raconter, moyennant des constructions syntaxiques diffrentes. Il est bitransitif doublement direct lorsquil se rapporte dire, bitransitif doublement ou simplement direct pour raconter et bitransitif direct et indirect lorsquil traduit parler. Cette dernire constatation le rapproche des nombreux verbes de parole franais dont les emplois en contexte se rapportaient tantt lun tantt lautre des deux gnriques, de manire souvent imprvisible. 5.1.1.3 Contraste entre les paradigmes verbaux Il existe dautres caractristiques importantes dans la syntaxe des verbes qui nous intressent ici. En particulier, nous remarquons que les verbes de type parler et laisser (cf. abandonner) sont potentiellement bitransitifs direct et indirect. Or, si lobjet direct est effaable sans influence sur la prsence de lobjet 2 avec parler (parler de quelque chose, parler quelquun), cela nest pas possible avec laisser (*laisser quelquun, *laisser de quelque chose) car la rpartition thmatique nest pas la mme. Dautre part, ces divergences syntaxico-smantiques ont une influence (et inversement, sens ou forme dabord ?) sur la slection de la nature smantique des arguments du verbe.

229

Facult physique qui est prcise par les dictionnaires et reproduite dans les informations complmentaires de notre base.
254

En guise de conclusion intermdiaire, nous constatons une fois de plus que lextrme complexit de la langue et du rapport interlangue rend ardu voire impossible le relev exhaustif des manifestations langagires observables.

5.1.2 Objectifs
5.1.2.1 Justifications Lalgorithme dont nous avons besoin doit pouvoir transformer chaque ligne du tableau en, respectivement : un objet structur de type mot qui contient des objets de type caractristiques du mot-source comprenant langue, collocobj1 et 2, collocsuj, constrLS, registre et infoscompls ; un objet structur qui contient des objets de type caractristiques du mot-cible comprenant langue, collocobj1 et 2, collocsuj, constrLC, registre et ventuellement infoscompls. Lunification entre ces deux structures est automatique, seule la construction tant ventuellement diffrente (rappelons quelle nest prcise que si le verbe est transitif indirect) ; ventuellement un ou deux objets structurs qui contiennent des objets de type caractristiques synonymes en langue source ou en langue cible comprenant exclusivement les informations contextuelles et cotextuelles (collocs, registre et infoscompls) ainsi que la langue ; un lien de synonymie directe entre le mot-source et le mot-cible ; des liens de synonymie partielle qui relient les termes des quatre premires colonnes en dehors du lien de synonymie directe prcit.

5.1.3 Dfinitions
5.1.3.1 Les objets structurs, attributs et valeurs En informatique, un objet structur est un ensemble de couples attribut/valeur. Un attribut est assimilable un type gnrique auquel est attribue une valeur spcifique. La valeur en question est une variable au type prdfini, obligatoire ou optionnelle (valeur par dfaut) : chane de caractres, lment dun ensemble, ensembles dobjets, classes ontologiques (issues dun ensemble), catgories, types en extension, etc.
255

Les objets que nous manipulons sont des lexies, auxquelles sont associs autant de couples attribut-valeur quil y a dinformations pertinentes dans notre tableau de synthse. Les lexies seront implantes sous la forme de structures sous forme dobjets dont nous allons prciser les attributs.
5.1.3.1.1 Rcapitulation des valeurs, type, facultativit, ontologie et valeurs par dfaut

Les attributs utiliss et leurs valeurs attendues sont les suivants partir des donnes strictement lexicographiques. Pour chacun, nous prsentons le type de la valeur, la prsence ou non dune nomenclature et la nature de celle-ci le cas chant, et enfin la valeur par dfaut ventuelle : Lemme chane de caractres obligatoire, correspondant au lexme lemmatis (infinitif pour les verbes, singulier pour les substantifs, masculin singulier pour les adjectifs, etc.), nomenclature finie mais extensible (conforme au lexique dune langue un instant donn et sensible son volution), pas de valeur par dfaut. Si le lemme nest pas renseign, il est impossible de construire une structure de mot-fantme. Catgorie type obligatoire, nomenclature finie et peu extensible, la catgorie par dfaut est normalement V comme verbe, mais deux facteurs obligent prciser la valeur pour toutes les lexies. En premier lieu, un verbe dune langue source peut tre traduit par un terme dune autre catgorie grammaticale en langue cible. Deuximement, un certain nombre de nos lexies sont des locutions verbales. Quel que soit le degr de figement de ces dernires, elles nont pas toutes les proprits syntaxiques lies labsolu figement. En particulier, il est toujours possible dinsrer un adverbe entre le lexme verbal et les autres constituants de la locution, ne serait-ce que le pas de ngation (cf. chapitre I ce propos), pas de valeur par dfaut. Lide de mettre verbe comme valeur par dfaut a t abandonne pour les raisons nonces ci-dessus.
256

Langue type obligatoire, une lexie appartient ncessairement une langue. nomenclature finie et extensible (si ajout de nouvelles langues dans les champs), pas de valeur par dfaut. Collocobj1 chane de caractres facultative, nomenclature potentiellement infinie, difficile dlimiter par une ontologie issue ou non du dictionnaire. Le problme le plus pineux est la confusion entre les collocations englobantes (dj ontologiques) et les collocations contextuelles, occurrentielles et/ou prototypiques. Les diffrents types apparaissent dans le dictionnaire sans distinction typographique. en cas dabsence de complment, la valeur par dfaut correspond aux constructions intransitives, ou transitives avec absence du complment hirarchiquement suprieur (emploi absolu). Collocobj2 chane de caractres facultative, pas ncessairement lie la prsence dun collocobj1, nomenclature potentiellement infinie, mme problmatique que pour collocobj1, la valeur par dfaut correspond aux constructions intransitives si collocobj1 nest pas explicite non plus, ou transitives avec absence du complment second.

257

Collocsuj chane de caractres facultative, bien que la prsence dun sujet soit obligatoire dans toutes les phrases, lexception des noncs au mode impratif, nomenclature potentiellement infinie, comme les collocobj, pas de valeur par dfaut. Si cet attribut na pas de valeur, nous devons en dduire que la nature du sujet nimporte pas . Malheureusement pour nous, ce parti pris est indfendable. Constr type et chane de caractres facultatifs, renvoie le cas chant lune des deux collocations objet, nomenclature finie et relativement facile constituer par recoupement des donnes rpertories dans la base. La nomenclature de Constr comprend toutes les constructions syntaxiques complexes, la valeur par dfaut renvoie soit lintransitivit si collocobj nest pas remplie, soit la transitivit directe sans prposition ni complmenteur. Registre type facultatif, pouvant tre de plusieurs sous-types : nous pouvons distinguer les domaines de spcialit des niveaux de langue et des zones gographiques demploi. nomenclature finie et assez facile raliser partir des donnes. Pour bien faire, il ne faut pas quil y ait de recouvrement dans les tiquettes des diffrents sous-types, la valeur par dfaut doit correspondre au langage courant non spcialis ni rgionalement marqu.

258

Infoscompls type ou chane de caractres facultatif, les infoscompls apportent des informations lies au contexte ou un approfondissement du registre prcdemment instanci, nomenclature potentiellement infinie et impossible raliser. Une information complmentaire est par nature imprvisible et inclassable. De plus, elles sont propres chaque lexie et peuvent trs bien napparatre quune fois dans la totalit de la base. Enfin, les informations complmentaires apportes par les tudes linguistiques sur corpus sont construites et augmentent dautant la liste. la valeur par dfaut nenlve ni najoute aucune information et ne signifie pas que la lexie na rien dire en dehors de ses caractristiques strictement structurelles et argumentales. Les rsultats des analyses partir de corpus nayant pas motiv la cration de nouvelles valeurs distinctives, la liste qui prcde est par consquent exhaustive en ce qui concerne notre travail en ltat actuel des choses.
5.1.3.1.2 Structure des lexies

Soit lexemple suivant, ligne extraite de notre base :


Figure 34 : Ligne slectionne de to leave
motsource LS motcible LC synLS SynLC obj1 obj2 Suj constrLS ConstrLC registre Infoscompls

leave

laisser

lguer

object, property

obj1 | to obj2 obj1 | a obj2

in will

En nous mettant la place de notre algorithme, cette ligne peut tre glose de la faon suivante : Le verbe anglais to leave peut tre traduit par le verbe franais laisser pour le cas o laction serait effectue par testament (in will), prenant comme objet direct un individu de type objet (object) ou proprit (property), et comme objet indirect nimporte quel individu prcd de to en anglais et de en franais. Dans ce contexte, le verbe franais lguer est galement une traduction potentielle de to leave ainsi que le synonyme contextuel (SPTC) de laisser en franais. Dautre part, le dictionnaire ne prvoit pas pour cette acception de contrainte sur la slection smantique du sujet ni de lobjet 2. Il ne propose pas non plus de synonyme du terme source (SPS).

259

Schmatiquement, les structures contextuelles230 correspondant notre ligne dexemple se prsentent comme suit. Laccs se fait partir dun identifiant dun couple attribut-valeur pouvant lui-mme tre structur : Leave1 { lemme = leave ; Cat = V ; Lang = A ; Constr = collocobj1 + to + collocob2j231 ; Collocobj1 classe = [object, property] ; Collocobj2 classe = [] ; Collocsuj classe = [] ; Registre = 0 ; Infoscompl = in will } Laisser1 { lemme = laisser ; Cat = V ; Lang = F ; Constr = collocobj1 + + collocobj2 ; Collocobj1 classe = [objet, proprit] ; Collocobj2 classe = [] ; Collocsuj classe = [] ; Registre = 0 ; Infoscompl = par testament } Lguer1 { lemme = lguer ; Cat = V ; Lang = F ; Constr = (quivalent laisser ) ; Collocobj1 classe = ([objet, proprit]) ; Collocobj2 classe = ([]) ; Collocsuj classe = ([]) ; Registre = (0) ; Infoscompl = (par testament) } Comme nous le voyons, une lexie est caractrise par son lemme, sa catgorie grammaticale, la langue laquelle elle appartient, puis par les constructions syntaxiques quelle induit, les collocations quelle admet dans un contexte de
230

Pour nous, une structure contextuelle est quivalente un objet structur reprsentant une lexie et ses conditions dapparition. 231 Cette ligne reprsente la concatnation dune valeur et de deux attributs. Ces derniers sont reprsents galement dans lobjet structur principal sous la forme de classes ontologiques.
260

traduction donn, et enfin le(s) registre(s) de langue li(s) ce contexte plus ventuellement des informations complmentaires sur la situation particulire dnonciation et plus rarement sur ltat desprit du locuteur, ce dernier nous paraissant essentiel bien que presque totalement ignor en lexicographie (voir chapitre III sur lanalyse du verbe traverser). Les informations ainsi codes sont de natures diverses ; il appartient au modle de faire apparatre ces modles distinctement grce la typographie utilise : Les chanes de caractre qui correspondent des fragments du discours sont prsentes entre guillemets ( laisser ). Les types gnraux destins situer la lexie dans son contexte mtalinguistique sont en majuscules (Langue, Catgorie). Les classes dobjets notoirement englobantes sont mises entre crochets car elles ne correspondent que rarement aux chanes de caractre rellement produites dans le discours ([objet, proprit]). Ce sont principalement des classes ontologiques dont le relev est conditionn par lontologie des dictionnaires de rfrence. Les informations pragmatiques sont mises entre apostrophes. Elles relvent la fois du discours (par testament et in will peuvent trs bien se retrouver derrire les verbes cits) et du mtalangage, car ce sont surtout des indicateurs situationnels. Tout ce qui nest pas prcis mais considrable comme valeur par dfaut est prsent comme un ensemble vide entre crochets. Enfin, les donnes ininterprtables partir du dictionnaire sont mises entre parenthses. Cest le cas ici pour lguer dont le fonctionnement syntaxique nest pas apparent, non plus que les contraintes de slection smantique des arguments. Toutefois, ces donnes sont rcuprables dans une autre ligne de la base, celle qui prsente lguer comme synonyme de traduction directe (ST) de to leave et laisser comme SPTC. Consquemment, la ligne du tableau que nous dcrivons sert avant toute chose prciser ce lien SPTC entre lguer et laisser par lintermdiaire du verbe anglais. Certaines informations propres aux lexies de rfrence ne sont pas mises en exergue dans la structure synLC ou LS. En effet, les constructions syntaxiques en particulier ne conservent pas ncessairement les mmes contraintes aprs substitution dun quivalent. En loccurrence, lguer se construit comme laisser, mais ce nest
261

quun hasard (voir doter (qqn de qqch) par opposition lguer (qqch qqn), par exemple). De mme, linformation complmentaire par testament peut tre considre comme redondante lorsquon laccole au verbe lguer, alors quelle manquerait fcheusement avec laisser qui ne comporte pas le trait testamentaire dans sa structure smantique intrinsque. Certains critres de reconnaissance lexicale sont invariants : lemme, catgorie grammaticale et langue. Tous les autres (construction, collocations, registre et informations complmentaires) sont propres aux contextes viss et naturellement subsums par la superstructure, laquelle correspond pour nous la fusion de toutes les structures contextuelles dun lemme donn. Ceci nexclut pas linvariabilit potentielle des critres dits fluctuants, comme lobjet direct pour traverser, qui est constant dans sa forme syntaxique lexception des emplois absolus. Il convient dajouter la superstructure de to leave toutes les donnes qui concernent cette lexie en tant que mot-cible. La construction des Lexiques Inverss montre quun complment dinformation lexicale non ngligeable est rcupr par ce biais. Autre remarque importante : notre structure initiale ne rendait pas compte des constructions bitransitives, alors mme que les exemples que nous prsentons sont souvent des verbes objets multiples. Par consquent, il sagit de faire apparatre les constructions de chaque verbe en contexte, et galement de prciser si les collocations exprimes sappliquent la forme transitive directe ou la forme indirecte. titre dexemple, notons quil ny a pas de double transitivit directe en franais du type *raconter une histoire quelquun mais possibilit en anglais, to tell somebody something versus to tell something to somebody , formes qui impliquent lintroduction de notions nouvelles de porte syntaxico-smantique du verbe ainsi que sa vise aspectuelle. En premier lieu, nous avons choisi de sparer les arguments complments en deux colonnes, lune pour les objets de type 1 (objets directs ou objets indirects pour les verbes monotransitifs) et lautre pour les objets de type 2 (le plus souvent objets indirects seconds, y compris ceux qui apparaissent aprs effacement de lobjet 1 attendu). 5.1.3.2 Unification des structures contextuelles : superstructure et sousstructures
5.1.3.2.1 Problmes lis lunification

Aprs avoir dfini les structures de chaque lexie, il reste les unifier. En cas de synonymie directe, absolue et partielle, lunification est automatique en cela que nous considrons ( juste titre) quune traduction respecte a priori le principe dunification des traits qui composent les lments lexicaux mis en jeu. Nous relevons un nouvel cueil : les objets structurs que nous dfinissons contiennent des informations contextuelles pour une lexie et non pas des donnes fixes
262

pour une unit lexicale tous emplois confondus. En dautres termes la structure du mot-source ne sapplique que pour un lien de traduction donn en direction dune lexie possdant la structure mot-cible correspondante. Partant du principe que nous souhaitons une seule tiquette de mot par lexme au sein du graphe final , il est donc ncessaire soit de simplifier les structures au maximum avec perte dinformations ou rcupration ultrieure dune sous-structure, soit dappliquer les structures aux liens232 et non aux tiquettes, voire de proposer des structures gnriques233 modulables (i.e. prvoyant toutes les conditions demploi de lunit lexicale considre, avec application du principe dunification sur une sous-structure de la structure gnrique). En dautres termes, nous entendons dterminer sil est prfrable dimplanter une structure dattributs valeurs multiples ou un ensemble unifi de structures dattributs valeurs contextuelles.
5.1.3.2.2 Une structure dattributs valeurs multiples

La structure gnrique incomplte et unifie de to leave pourrait se prsenter comme suit, les virgules indiquent la disjonction entre plusieurs lments concurrents : Superstruct mot-source { lemme = leave , left ; Cat = V ; Lang = A ; Constr = collocobj1, collocobj1 + to + collocobj2, 0 ; Collocobj1 = [person], [thing], [place], [object, property], [human being], [animal], etc. ; Collocobj2 class = [person],[], etc. ; Collocsuj class = [person], [animal], [], etc. ; Registre = 0 ; Infoscompl = in will, 0 } Il reste la relier dautres structures gnriques en ne perdant pas de vue que les liens ne concernent que des sous-structures : SuperStruct mot-cible { lemme = laisser , cf.< conj laisser > ; Cat = V ;
232

Ce que nous entendons par Appliquer les structures contextuelles aux liens suppose que nous demandions lalgorithme de relier ces structures aux liens de synonymie quelle gnre. Cette solution est celle que nous avons retenue au final par lintermdiaire dindices incrments chaque fois quon change de lexie. 233 Structures gnriques et superstructures sont quivalentes en terminologie et correspondent lensemble unifi des structures contextuelles pour une unit lexicale donne.
263

Lang = F ; Constr = collocobj1, collocobj1 + + collocobj2 ; Collocobj1 class = [qqn], [qqchose], [objet, proprit] ; Collocobj2 class = [qqn] ; Collocsuj class = [] ; Registre = 0 ; Infoscompl = par testament=>collocobj1 class proprit] Indice = x} Struct synLC { lemme = lguer ; Cat = V ; Lang = franais ; Constr TI = ( + collocobj) ; Collocobj class = objet, proprit ; Collocsuj class = []; Registre = []; Infoscompl = (par testament) Indice = y }

[objet,

Lunification des sous-structures partir des structures gnriques suppose que le systme soit capable dextraire les informations lies un emploi, et lui seul. De ce fait, chaque fois quune donne est encode, il faut lui associer un indice qui la relie aux autres donnes contextuelles associes, do la prsence de indice en fin de sousstructure. Ce systme de renvois systmatiques revient finalement cacher des sousstructures contextuelles dans un ensemble complet. Dans une perspective dimplmentation, il nous parat possible de raliser cette unification des sousstructures idoines laide dun systme de pointeurs, bien que cette mthode soit particulirement coteuse en temps de programmation. Unification Struct mot-source Struct mot-cible { lemmes = to leave |234 laisser ; Cat = V ; Lang = anglais | franais ; Constr TI = monotrans collocobj1 | ditrans collocobj1, + collocobj2 ; Collocobj1 class = [qqn], [qqchose], [objet, proprit] ; Collocobj2 class = [qqn];
234

Le sparateur | marque le passage des caractristiques de la langue de la premire lexie celles de la deuxime lexie.
264

Collocsuj class = []; Registre = []; Infoscompl = par proprit] }


5.1.3.2.3

testament=>collocobj1

class

[objet,

Prtendre lexhaustivit , est-ce trop prtentieux ?

La solution de lexhaustivit initiale nous parat peu envisageable en raison du trop grand nombre de formes et de collocations subsumes par des lexies aussi polysmiques que celles sur lesquelles nous travaillons. Noublions pas que nous tudions dabord les rapports lexico-conceptuels entre mots de langues diffrentes, afin entre autres et avant tout de faire merger des liens de sens entre ces dernires. En thorie, lemploi dun mot en contexte induit la subsomption dune structure spcifique de traits langagiers par une structure plus vaste qui prvoit lensemble des traits pertinents (i.e. potentiels) pour un lexme donn. En ce sens, il est tout autant impossible dimaginer lintgralit des structures contextuelles possibles que la superstructure qui les engloberait toutes. En thorie toujours, la reprsentation contexto-conceptuelle tendue dune seule unit lexicale est hors des comptences humaines. En pratique, les ouvrages lexicographiques synthtisent les sens spcifiques pour les rendre accessibles notre entendement, notre cerveau se chargeant de dsynthtiser les donnes acquises, chaque emploi dun mot. Toutefois, ltude en corpus nous fait rapidement franchir puis clater les bornes imposes par la norme lexicale en ramenant le sens (la structure spcifique) un contexte langagier non synthtique. Cest le chemin quemprunte Franois Recanati (1997) pour laborer sa thorie observable de la polysmie absolue 235.
5.1.3.2.4 La superstructure comme ensemble de sous-structures

Grce la constitution de nos bases de donnes, nous pouvons laborer des superstructures qui unifient automatiquement toutes les sous-structures dun lexme donn, ces sous-structures tant elles-mmes gnres automatiquement partir de la base de donnes dorigine, conformment lalgorithme de construction des CSMU que nous dcrivons ici. Subsquemment, la superstructure est une structure la fois subsumante et rsultante des sous-structures. Lorigine est le fruit de ses avatars, paradoxalement, et pourtant la base de notre thorie structurelle. Les structures contextuelles et les superstructures sont tout aussi importantes : les premires dterminent les liens lexico-smantiques entre deux lexies et les secondes constituent la structure relle, i.e. complte, dune unit lexicale dans le
235

Revoir sur ce sujet la polysmie, a nexiste pas ? , chapitre I du prsent document.


265

graphe. Loin de sopposer, les donnes contextuelles et lexicographiques trouvent ainsi un terrain dunification par lintermdiaire de lalgorithme. Si nous reprenons notre fragment-exemple du verbe to leave, nous pouvons proposer une reprsentation simple de la superstructure de la lexie :
Figure 35 : Fragment slectionn de to leave
motsource leave leave LS a a a a motcible laisser quitter LC synLS f f f f SynLC lguer obj1 object, property job, husband, wife person, train, ship, etc obj2 suj constrLS constrLC registre infoscompls in will obj1 | to obj2 obj1 | a obj2

leave

partir

go away

sen aller

leave

partir

resign

dmissionner

Superstruct mot-source { { lemme = leave ; Cat = V ; Lang = A ; Constr = collocobj1 + to + collocobj2 ; Collocobj1 classe = [object, property] ; Collocobj2 classe = [] ; Collocsuj classe = [] ; Registre = 0 ; Infoscompl = in will Indice = x }, { lemme = leave ; Cat = V ; Lang = A ; Constr = collocobj1 ; Collocobj1 classe = [job, husband, wife] ; Collocobj2 classe = [] ; Collocsuj classe = [] ; Registre = 0 ; Infoscompl = 0 Indice = y }, { lemme = leave ; Cat = V ; Lang = A ; Constr = 0 ; Collocobj1 classe = [] ;
266

Collocobj2 classe = [] ; Collocsuj classe = [person, train, ship, etc.] ; Registre = 0 ; Infoscompl = 0 Indice = z }, { lemme = leave ; Cat = V ; Lang = A ; Constr = 0 ; Collocobj1 classe = [] ; Collocobj2 classe = [] ; Collocsuj classe = [] ; Registre = 0 ; Infoscompl = 0 Indice = w } } Cet ensemble ne rend pas compte des liens lexicaux que chaque sous-structure induit. Cela est le rle de la base de donnes telle quelle est conue, ainsi que celui de lalgorithme de construction du graphe synonymique que nous allons dcrire.

267

Dans la superstructure de type verbe, il apparat judicieux dessayer de co-crire les attributs de type construction et objets pour viter de sur-spcifier dans la structure et parce quune construction donne se rapporte des types smantiques et ontologiques darguments. Pour ce faire, nous pouvons laborer une liste exhaustive des constructions possibles en partant du principe que toute lexie possde une construction de type objet1-objet2 pour laquelle la prsence dun des deux objets (ou des deux la fois) nest pas obligatoire :
Figure 36 : Typologie des constructions syntaxiques associes au verbe236

Type Intransitif Monotransitif direct Monotransitif indirect Bitransitif doublement direct Bitransitif direct et indirect Bitransitif doublement indirect Bitransitif indirect et direct

Objet1 ^ / ^ // / ^ /

Objet2 ^ ^ / ^ / // / (*avec inversion de lordre des complments*)

Cette typologie ne rend pas toujours compte de lordre des arguments dans le cas dune bitransitivit doublement directe ou doublement indirecte. Dans certains cas, cet ordre na aucune importance : on peut tout aussi bien parler de quelque chose quelquun que parler quelquun de quelque chose sans nuance rellement perceptible. Toutefois, il existe des cas de bitransitivit double pour lesquels lordre des arguments nest pas fortuit : to tell somebody something nest pas quivalent *to tell something somebody dont la forme correcte est to tell something to somebody (bitransitif direct et indirect) ; une telle dichotomie nest pas possible en franais : *raconter quelquun quelque chose est une forme exclue. Consquemment, la question ne se pose pas en franais et dans les autres langues romanes, o lordre des complments habituels nest que trs rarement contraint autrement que pour des raisons narratives et stylistiques (thmatisation, emphase voire esthtique de la phrase), mais il faut parfois la prendre en compte pour langlais. En plaant constructions et objets dans le mme type, nous obtenons un attribut constrelementlangue qui est soit un couple {type, info type dobjet} soit un mnage trois {type, objet1, objet2}. Dans le premier cas, info type dobjet reste un attribut type multiple quil nous appartient de sparer en {objet1, objet2}. Dans le second, type
236

Dans ce tableau, le symbole ^ correspond absence de (objet 1 ou 2) et le / signifie prsence de . Si la barre oblique est double (//), on doit comprendre prsence deux fois de lobjet considr.
268

correspond la construction releve dans le tableau ci-dessus et objet1-objet2 sont les attributs correspondant la forme et la nature de chacun des arguments complments. Il ne reste plus qu dfinir la liste exhaustive des constructions possibles dans chacune des langues tudies afin de constituer une bibliothque de types laquelle lalgorithme pourra se rfrer si ncessaire. 5.1.3.3 Implantation des liens
5.1.3.3.1 Travail sur les structures

Les liens que nous implantons aboutissant essentiellement des unifications de structures de donnes, la manipulation de listes nous parat une des meilleures manires de procder. La premire tape dunification concerne la concatnation des structures contextuelles en une mme superstructure, comme nous lavons dcrit dans les paragraphes prcdents. Deux solutions soffraient nous : Soit la superstructure est conue comme une liste dobjets structurs, ceci permettant en particulier dimplanter les sous-structures dans leur ensemble sans mlanger leurs traits avec ceux des autres. Cette solution est la plus facile transformer en code mais est nettement plus coteuse en cases mmoire. Rappelons ce que cela donne : Superstruct mot-source { [lemme = leave , cf.conj leave; Cat = V; Lang = anglais; Constrelementlangue ={BitransDI237, objet1, to objet2} ; Objet1 = [] ; objet2 =[ object, property]; Sujet = []; Registre = []; Infoscompl = in will Indice = x ], [lemme = leave , cf.conj leave; Cat = V ; Lang = anglais ; Constrelementlangue ={MonotransD238, objet1, objet2} ;
237

Bitransitif direct et indirect, pour lequel seule le contenu smantique lobjet indirect second est prcis.
269

Objet1 = [somebody]; objet2 =[ ]; Sujet = [ ]; Registre = [ ]; Infoscompl = in will Indice = y ], [etc.] } Soit la superstructure est construite comme un superobjet structur contenant pour chaque attribut autant de valeurs quil y a de traits dans une structure contextuelle. Cette dernire solution est prfrable pour une simplification de la superstructure, ainsi quen termes dconomie de mmoire ; toutefois, elle contraint le programmeur mettre des pointeurs sur chaque trait afin de le rattacher aux autres traits dont il est le voisin en contexte239. Superstruct mot-source { lemme = leave , cf.conj leave Cat = [V] Lang = [anglais] Constr TI = [monotrans collocobj1 ; ditrans collocobj1, to + collocobj2] Collocobj1 class = [[person] ; [sth] ; [place] ; [object, property], etc.] Collocobj2 class = [[person], etc.] Collocsuj class = [] Registre = [] Infoscompl = [in will=>collocobj1 class [object, property]] } Le choix que nous avons fait est dtablir les sous-structures comme traits relatifs la synonymie contextuelle reliant deux termes, et dautre part daffecter aux tiquettes de mots la runion de toutes les structures contextuelles les concernant. Par consquent, cest la solution de la concatnation des objets structurs (et non celle de leur fusion) que nous avons choisie.

Monotransitif direct pour lequel seul lobjet1 est attendu. Si nous choisissons de faire de constrelementlangue un attribut trois types, objet2 est mentionn mme sil nest pas pourvu. 239 plus des pointeurs de chaque lment sur la structure contextuelle subsumante
270

238

5.1.3.3.2

Notions densembles et dobjets structurs

Un ensemble est une suite dlments qui peuvent tre dfinis de deux manires : soit en extension, auquel cas lensemble correspond une liste dlments distincts et disjoints du type {x1 x2 x3xn} ; soit en intension, ce qui revient manipuler un mme lment un nombre de fois dfini : {x*} (x rpt un nombre de fois quelconque), {x+} (x rpt au moins une fois), {x*}4 (x rpt quatre fois), etc. Un objet structur est un ensemble de couples attribut-valeur, comme nous lavons dj dit prcdemment. Une valeur peut elle-mme tre un couple attributvaleur, ce qui permet une grande modularit des objets et sous-objets manipuls. Dans notre nomenclature, un mot est dfini par un ensemble sous-forme de quadruplet contenant quatre lments, lesquels sont des attributs : mot = {lemme, catgorie, langue, constr} Une lexie, au sens o nous employons ce terme, est caractrise par un ensemble contenant les mmes informations que le mot (au moins les trois premires), augment dinformations portant sur lemploi prcis de la lexie en contexte : lexie = {lemme, catgorie, langue, constrelementlangue, registre, infoscompls}
5.1.3.3.3 Listes et liens de synonymie

Les synonymes dun terme source sont implants au fur et mesure de leur dtection dans une liste dont il est la tte. Lors de lappel de fonction qui permet la cration de liens de synonymie, le terme cible est plac en queue de liste et sa structure lui est associe. Notre premire intention fut de dterminer les traits inhrents un lien donn sous la forme dune liste chane. De cette faon, il y aurait inclusion de listes chanes (les structures de traits) dans une liste chane principale (les synonymes de type X dun terme source), laquelle serait elle-mme un lment dune liste chane dordre suprieur (la liste des listes de synonymes, chacune de ces dernires se rapportant un type de lien diffrent (cf. diffrents liens de synonymie)). Pour de simples raisons pratiques, nous pensons prfrable de traiter les structures de traits part : superstructures (ou liste dobjets structurs) pour les tiquettes lexicales, et les objets structurs (ou structures contextuelles) pour chaque ligne de la base de donnes. Dans cette perspective, il sera peut-tre ncessaire de
271

crer des pointeurs associs aux lexies prsentes dans les listes et pointant sur lesdites structures. Ce parti pris nous ramne la rflexion autour du sens du mot : est-ce quun pointeur est mme de reprsenter le sens de manire globale ? 5.1.3.4 Les fonctions De nombreuses fonctions de programmation peuvent tre ncessaires pour limplantation des CSMU : fonctions dextraction des donnes depuis la base, fonctions de construction des structures, fonctions de mise en correspondance des lexies avec les structures, fonctions de synonymies, etc. Nous allons prsent en dcrire les plus importantes, en laissant de ct les plus usuelles, savoir les fonctions dj existantes dans les bibliothques de fonctions prtablies que chaque compilateur doit avoir en mmoire. Tout ce que nous allons dcrire est indpendant dun langage de programmation quelconque, bien que nous fussions de prime abord inspir par celui que nous connaissons le mieux, le langage C. Nous commenons par tablir des profils de reprsentation. Toute fonction se caractrise par quatre lments : son nom qui prcise ce quelle fait, les paramtres quelle utilise pour fonctionner, le rsultat du traitement des paramtres et le programme qui lui permet dobtenir ce rsultat. Dans la suite, nous ne parlerons que des trois premiers car nous nous limiterons lcriture dun algorithme simple sans prsumer de sa programmation. Dans lordre, nous crirons les fonctions sur le modle suivant : (RESULTAT :type paramtre) du rsultat) : NOM_FONCTION (PARAMTRES :type du

Les trois fonctions dont nous avons normalement besoin pour raccorder les donnes sont Ajouter, Rechercher et Supprimer. La fonction Modifier est galement indispensable mais elle se rsume Rechercher + Supprimer + Ajouter. Il nest donc pas ncessaire de la redfinir. Dans les lignes de code darrive, les fonctions rechercher et supprimer ont t ignores ou plus exactement fondues dans les fonctions ajouter qui seront au nombre de trois.

5.2 Lalgorithme
Dans la premire version de lalgorithme que nous avons conue, nous avions spar distinctement les tapes suivantes : extraction des donnes de la base, construction des superstructures pour chaque lexie, constitution des entres par la concatnation des superstructures, implantation des liens de synonymie et raccordement des liens aux lexies. Ce mode dcriture linaire a pos dinsolubles problmes, notamment dans la mise en correspondance des liens avec les bonnes
272

superstructures puis avec les lexies. Nous vous pargnerons la lecture de cet algorithme demeur inachev. En dfinitive, toutes les oprations devaient pouvoir tre effectues en une seule manuvre, ce qui nous a amen concevoir une autre version que nous allons prsenter ci-dessous. Tout dabord, nous prsentons lalgorithme final sans le commenter. Puis nous le dtaillerons avec des commentaires ligne par ligne afin den dcrypter le fonctionnement. Ensuite, nous poursuivrons le travail de description en expliquant dabord les fonctions et les objets que nous avons manipuls, puis en dtaillant toutes les tapes de lalgorithme en langage naturel, explications supplmentaires incluses. Enfin, nous terminerons ce chapitre en essayant de montrer ce que nos bases de donnes et lalgorithme associ peuvent apporter aux reprsentations multilingues, la lexicographie et ventuellement laide la traduction automatique et semiautomatique assiste par ordinateur.

5.2.1 Lalgorithme sans commentaire


Quelques explications sur la typographie choisie sont ncessaires pour faciliter la lecture de lalgorithme : Les fonctions sont en petites majuscules ; les ensembles dobjets de mme type sont nots entre crochets {} ; les ensembles de couples attributvaleur htroclites sont entre parenthses ( ) ; les oprateurs habituels (boucles, actions, conditions, etc.) sont souligns ; les constantes en position de valeur sont entre guillemets ; Les variables sont crites avec une majuscule initiale (et peuvent tre intgralement crites en grandes majuscules pour certaines) ; chaque ligne de code active de lalgorithme se termine par un point virgule.
(Dico : Ensemble dobjets) : EXTRACTDONNEES (BD : xls) (Valeur : Chane de caractres) : EXTRACT (TAB[x, y] : tableau) (Dico : Ensemble dobjets) : AJOUT (Objdico : (Lemme, Cat, Lang, Econstr), Dico : Ensemble dobjets) (Liens : Ensemble de liens) : AJOUTLIEN (Lien : (Indice, Indice, Type), Liens : Ensemble de liens) (Econstr : Ensemble de constructions) : AJOUTCONSTR (Eltconstr : ( Constr, Collocobj1, Collocobj2, Collocsuj, Registre, Info compl), Econstr : Ensemble de constructions) Ensemble-dobjets : (Objdico, Liens) Objdico : (Lemme, Cat, Lang, Econstr) Liens : {lien} Lien : (Indice, Indice, Type) (Econstr : ensemble de constructions) : {Eltconstr} Eltconstr : ( Constr, Collocobj1, Collocobj2, Collocsuj, Registre, Info compl) Dico = {^} ; Liens = {^} ; Ligne = 1 ; Motsource = TAB[ligne, 1] ; LS = TAB[ligne, 2] ;
273

Numcons = 0 ; Tant que motsource .NE. ^ rpter Econstr = {^} ; Tant que (Motsource, LS)= (TAB[ligne, 1], TAB[ligne, 2]) rpter Numcons = Numcons + 1 ; IndiceMS = Numcons ; Numcons = Numcons + 1 ; EltconstrMS = (Constr = EXTRACT (TAB[ligne,10]), Collocobjet1 = EXTRACT (TAB [ligne, 7]), Collocobjet2 = EXTRACT (TAB [ligne, 8]) , Collocsuj = EXTRACT (TAB [ligne, 9]), Registre = EXTRACT (TAB [ligne, 12]), Infoscompls = EXTRACT (TAB [ligne, 13]), IndiceMS) ; MC = EXTRACT (TAB[ligne, 3]) ; LC = EXTRACT (TAB[ligne, 4]) ; SMC = EXTRACT (TAB[ligne, 6]) ; SMS = EXTRACT (TAB[ligne, 5]) ; IndiceMC = Numcons ; Numcons = Numcons + 1 ; EltconstrMC = (Constr = EXTRACT (TAB[ligne,11]), Collocobjet1 = EXTRACT (TAB [ligne, 7]), Collocobjet2 = EXTRACT (TAB [ligne, 8]) , Collocsuj = EXTRACT (TAB [ligne, 9]), Registre = EXTRACT (TAB [ligne, 12]), Infoscompls = EXTRACT (TAB [ligne, 13]), IndiceMC) ; EconstrMC = {EltconstrMC} ; AJOUTLIEN (Liens, (IndiceMS, IndiceMC, ST ) ; Objdico = (Lemme = MC ; Cat = V ; Lang = LC ; Constr = EconstrMC) ; Dico = AJOUT (Dico, Objdico) ; Si SMS .NE. ^ alors dbut IndiceSMS = Numcons ; Numcons = Numcons + 1 ; EltconstrSMS = (IndiceSMS) ; EconstrSMS = {EltconstrSMS} ; AJOUTLIEN (Liens, (IndiceSMS, IndiceMC, SI ) ; AJOUTLIEN (Liens, (IndiceSMS, IndiceMS, SPS ) ; objdico = (lemme = MC ; cat = V ; lang = LC ; Constr = EconstrMC) ; Dico = AJOUT (Dico, objdico) ; fin Si SMC .NE. ^ alors dbut IndiceSMC = Numcons ; Numcons = Numcons + 1 ; EltonstrSMC = (IndiceSMC) ; EconstrSMC = {EltconstrSMC] ;
274

AJOUTLIEN (Liens, (IndiceMS, IndiceSMC, ST ) ; AJOUTLIEN (Liens, (IndiceSMC, IndiceMC, SPTC ) ; AJOUTLIEN (Liens, (IndiceMC, IndiceSMC, SPTC ) ; Objdico = (Lemme = SMC ; Cat = V ; lang = LC ; Constr = EconstrSMC) ; Dico = Ajout (Dico, Objdico) ; fin Si SMS .NE. ^ et SMC .NE. ^ alors AJOUTLIEN (Liens, (IndiceSMS, IndiceSMC, SI ) EconstrMS = AJOUTCONSTR(EconstrMS, EltconstrMS) ligne = ligne +1 Fintantque1 objdico = (lemme = Motsource ; cat = V ; lang = LS ; Constr = Econstr) Dico = Ajout (Dico, objdico) Fintantque2

5.2.2 Lalgorithme comment


Ci-dessous, nous allons expliquer le fonctionnement de lalgorithme ligne par ligne comme si nous tions lintrieur du programme en train de tourner. chaque opration, nous allons voir ce qui se passe, ce qui est cr ou ce qui est ignor. Les commentaires sont en criture normale et placs entre balises /* () */ : /***Dclaration des fonctions et des objets utiliss dans lalgorithme***/
(Dico : Ensemble-dobjets) : EXTRACTDONNEES (BD :xls)

/*EXTRACTDONNEES est une fonction qui transforme la base de donnes en un ensemble dobjets structurs sous lappellation Ensemble-dobjets, dfini plus bas. Cette fonction correspond aux actions de lalgorithme tout entier*/
(Valeur : Chane de caractres) : EXTRACT (TAB[x, y] : tableau) (Dico : Ensemble dobjets) : AJOUT (Objdico : (Lemme, Cat, Lang, Econstr), Dico : Ensemble dobjets) (Liens : Ensemble de liens) : AJOUTLIEN (Lien : (Indice, Indice, Type), Liens : Ensemble de liens) (Econstr : Ensemble de constructions) : AJOUTCONSTR (Eltconstr : ( Constr, Collocobj1, Collocobj2, Collocsuj, Registre, Info compl), Econstr : Ensemble de constructions) Ensemble-dobjets : (Objdico, Liens)

/*Le type du rsultat Ensemble-dobjets, cest un couple compos de lensemble des constructions de chaque mot et de la liste des liens*/
Objdico : (Lemme, Cat, Lang, Econstr)

/*Un ObjDico est caractris par son lemme, sa catgorie et sa langue (invariables pour un mot donn), et par lensemble des constructions dun mot donn*/
Liens : {lien}
275

/*Lensemble Liens est constitu de tous les liens de synonymie qui ont t implants partir de lalgorithme*/
Lien : (Indice, Indice, Type)

/*Lobjet Lien est un triplet constitu de deux indices (le premier se rapporte au premier lment et le second au second lment runis par un lien de synonymie) et dun type (cest--dire de quel lien de synonymie il sagit)*/
(Econstr : ensemble de constructions) : {Eltconstr}

/*Dfinition de lensemble des constructions qui est compos de la liste de toutes les constructions qui correspondent une lexie donne*/
Eltconstr : ( Constr, Collocobj1, Collocobj2, Collocsuj, Registre, Info compl)

/*Dfinition dune construction, EltConstr est un lment de construction dune lexie et se compose des informations prsentes dans la ligne de la lexie et qui sont utiles pour la distinguer des autres lexies : Les collocations objet et sujet, la construction syntaxique, le registre et les informations complmentaires sil y a lieu. Eltconstr ne comprend pas les valeurs lemme, langue, catgorie qui sont communes toutes les lexies dun mme terme*/ /***Fin de dclaration des fonctions et des objets utiliss dans lalgorithme***/
Dico = {^} ; Liens = {^} ;

/*Initialisation du dictionnaire et de lensemble des liens*/


Ligne = 1 ; Motsource = TAB[ligne, 1] ; LS = TAB[ligne, 2] ; Numcons = 0 ;

/*Les quatre dernires lignes permettent dindiquer que lon va oprer sur la premire ligne du tableau, dans laquelle le Motsource correspond au contenu de la premire colonne et la langue source (LS) au contenu de la deuxime. Par ailleurs, le compteur Numcons destin donner des indices chaque construction et chaque lien est galement initialis*/
Tant que motsource .NE. ^ rpter

/*Dbut de la premire boucle : traitement de la base de donnes dans sa totalit : tant que la case motsource nest pas vide, on continue les oprations qui suivent dans lalgorithme. En dautres termes, lalgorithme tourne tant que lon nest pas arriv au bout de la base de donnes*/
Econstr = {^} ;

/*Lensemble des constructions est initialis pour chacun des termes traits*/
Tant que (Motsource, LS)= (TAB[ligne, 1], TAB[ligne, 2]) rpter

/*Dbut de la deuxime boucle, traitement des lignes concernant un mot source et un seul : tant que Motsource correspond au mme lemme et la mme langue que celui

276

de la ligne prcdente, on effectue les oprations qui suivent lintrieur de la boucle240*/


Numcons = Numcons + 1 ; IndiceMS = Numcons ; Numcons = Numcons + 1 ;

/*Lindice Numcons est incrment une premire fois et sa valeur est transmise au mot source (via IndiceMS) puis on lincrmente nouveau en prvision de sa prochaine utilisation*/
EltconstrMS = (Constr = extract(TAB[ligne,10]), Collocobjet1 = extract (TAB [ligne, 7]), Collocobjet2 = extract (TAB [ligne, 8]) , Collocsuj = extract (TAB [ligne, 9]), Registre = extract (TAB [ligne, 12]), Infoscompls = extract (TAB [ligne, 13]), IndiceMS) ;

/* une lexie du mot source, on affecte constrMS, i.e. toutes les informations smantiques et syntaxiques associes cette lexie dans la ligne parcourue par lalgorithme. On y intgre galement lindiceMS qui a t initialis plus haut.*/
MC = TAB[ligne, 3] ; LC = TAB[ligne, 4] ; SMC = TAB[ligne, 6] ; SMS = TAB[ligne, 5] ;

/*De mme que pour le mot source dans la boucle suprieure, on fait correspondre aux objets mot cible, langue cible, synonyme langue source et synonyme langue cible le contenu des cases qui leur correspondent, en guise de valeur. La langue de SMS et celle de SMC nont pas besoin dtre dclares ici car elles sont identiques respectivement aux LS et LC de MS et MC*/
IndiceMC = Numcons ; Numcons = Numcons + 1 ;

/*Lindice incrment plus haut est affect au mot source et il est incrment pour sa prochaine utilisation*/
EltconstrMC = (Constr = extract(TAB [ligne,11]), Collocobjet1 = extract (TAB [ligne, 7]), Collocobjet2 = extract (TAB [ligne, 8]) , Collocsuj = extract (TAB [ligne, 9]), Registre = extract (TAB [ligne, 12]), Infoscompls = extract (TAB [ligne, 13]), IndiceMC) ;

/*A la traduction dune lexie du mot source, on affecte ConstrMC, i.e. toutes les informations smantiques et syntaxiques associes cette traduction dans la ligne parcourue par lalgorithme. On lui affecte galement lIndiceMC qui a t initialis plus haut.*/
EconstrMC = {EltconstrMC} ;

/*tant donn que le mot cible sera trait part en tant que mot source, lensemble des constructions de MC est circonscrit lobjet EltconstrMC qui ne comprend quun seul
240

On suppose pour cela que les lexies sont classes par ordre alphabtique du mot source dans la base initiale.
277

ensemble dinformations syntaxiques et smantiques. Si on rencontre le mme terme dautres fois en traduction du mot source trait dans la boucle, la mme opration sera rpte.*/
AJOUTLIEN (Liens, (IndiceMS, IndiceMC, ST)) ;

/*Cette fonction ajoute la liste des liens le lien de synonymie ST qui existe entre le MS et le MC (lien orient).*/
Objdico = (Lemme = MC ; Cat = V ; Lang = LC ; Constr = EconstrMC) ; Dico = AJOUT (Dico, Objdico) ;

/*Ajout dans le dico de lentre MC. Si elle nexiste pas encore, lentre est cre. Si elle existe dj, la fonction AJOUT se contente de vrifier si le Constr fait dj partie de lentre et si non, elle ly ajoute*/ /*** Traitement des synonymes LS et LC prsents dans la base***/
Si SMS .NE. ^ alors dbut

/*La prsence dun SMS ntant pas systmatique dans une ligne, on vrifie dabord sa prsence : les lignes suivantes ne sont oprationnelles que sil y a un SMS*/
IndiceSMS = Numcons ; Numcons = Numcons + 1 ;

/*La valeur du compteur Numcons est affecte SMS via IndiceSMS et on lincrmente pour sa prochaine utilisation*/
EltconstrSMS = (IndiceSMS) ; EconstrSMS = {EltconstrSMS} ;

/*EltconstrSMS ne contient que lindice qui permet de rfrer au SMS car aucune information syntaxique et smantique ne lui correspond directement dans la ligne o il apparat. Linformation est rpercute sur EconstrSMS afin de permettre la cration de lentre*/
AJOUTLIEN (Liens, (IndiceSMS, IndiceMC, SI )) ; AJOUTLIEN (Liens, (IndiceSMS, IndiceMS, SPS )) ;

/*Les trois liens de synonymie lis la prsence dun SMS sont implants dans la liste Liens, sauf si ces liens existent dj*/
objdico = (lemme = MC ; cat = V ; lang = LC ; Constr = EconstrMC) ; Dico = AJOUT (Dico, objdico) ;

/*Ajout dans Dico de lentre SMS. Si elle nexiste pas encore, lentre est cre. Si elle existe dj, la fonction ajout se contente de vrifier si le Eltconstr fait dj partie de lentre et si non, elle ly ajoute */
fin Si SMC .NE. ^ alors dbut

/*La prsence dun SMC ntant pas systmatique dans une ligne, on vrifie dabord sa prsence : les lignes suivantes ne sont oprationnelles que sil y a un SMC*/
IndiceSMC = Numcons ; Numcons = Numcons + 1 ;
278

/*La valeur du compteur Numcons est affecte SMC et on lincrmente pour sa prochaine utilisation*/
EltconstrSMC = (IndiceSMC) ; EconstrSMC = {EltconstrSMC} ;

/*EltconstrSMC ne contient que lindice qui permet de rfrer au SMC car aucune information syntaxique et smantique ne lui correspond directement dans la ligne o il apparat. Linformation est rpercute sur EconstrSMC afin de permettre la cration de lentre*/
AJOUTLIEN (Liens, (IndiceMS, IndiceSMC, ST ) ; AJOUTLIEN (Liens, (IndiceSMC, IndiceMC, SPTC )) ; AJOUTLIEN (Liens, (IndiceMC, IndiceSMC, SPTC )) ;

/*Les trois liens de synonymie lis la prsence dun SMC sont implants dans la liste Liens, sauf si ces liens existent dj*/
Objdico = (Lemme = SMC ; Cat = V ; lang = LC ; Constr = EconstrSMC) ; Dico = Ajout (Dico, Objdico) ;

/*Ajout dans Dico de lentre SMC. Si elle nexiste pas encore, lentre est cre. Si elle existe dj, la fonction AJOUT se contente de vrifier si le Eltconstr fait dj partie de lentre et si non, elle ly ajoute */
fin Si SMS .NE. ^ et SMC .NE. ^ alors AJOUTLIEN (Liens, (IndiceSMS, IndiceSMC, SI )

/*Seulement en cas de prsence conjointe dun SMS et dun SMC dans la mme ligne, un nouveau lien de synonymie est implant*/
EconstrMS = AJOUTCONSTR(EconstrMS, EltconstrMS)

/*Dernire opration de la boucle tantque qui traite une lexie : EltconstrMS est ajoute la liste Econstr des constructions de MS*/
ligne = ligne +1

/*On incrmente ligne pour traiter la ligne suivante dans la base, puis retour au dbut de la boucle*/
Fintantque1

/* Une fois quon sort de la boucle et en cas de passage un autre MS, le mot source qui vient dtre trait est ajout Dico*/
objdico = (lemme = Motsource ; cat = V ; lang = LS ; Constr = Econstr) Dico = Ajout (Dico, objdico) Fintantque2

/***Fin de lalgorithme, il ny a plus de lexie traiter dans le tableau***/

279

5.2.3 Description des fonctions et objets manipuls


5.2.3.1 Les fonctions utilises Cinq fonctions apparaissent dans lalgorithme, la premire qui sert de chapeau tout le programme est EXTRACTDONNEES ; la deuxime EXTRACT permet de formater le contenu de chaque cellule du tableau et deffectuer sa transformation en couple attribut-valeur si la cellule est non vide ; les trois autres sont des fonctions dajout dobjets un ensemble, AJOUTMOT, AJOUTLIEN et AJOUTCONST. Ces trois dernires fonctions peuvent effectuer des oprations complexes qui ne sont pas dtailles dans lalgorithme parce quelles sont facilement explicables : EXTRACTDONNEES. Cette fonction prend en paramtre la base de donnes au format Excel et la transforme en un graphe multilingue achev. Il sagit en fait de la fonction directrice de lalgorithme et en comprend la totalit des oprations. Sous EXTRACTDONNEES sont effectues toutes les tapes de rcupration des donnes de chaque ligne de la base, de la construction des structures contextuelles ltablissement des liens de synonymie en passant par la constitution des ensembles : superstructures pour chaque terme, liste des liens, ajout des mots dans le dictionnaire principal, etc. EXTRACT. Cette fonction a pour but de rcuprer les valeurs de chaque attribut (Constr, Collocobj et suj, etc.) dune lexie ou dun mot. Sa prsence nest thoriquement pas indispensable ds lors quon considre quon peut affecter une valeur nulle un attribut. Cest prcisment pour cette raison que nous utilisons EXTRACT car laction de la fonction se dcompose comme suit : EXTRACT recherche dabord si llment vis existe dans la base. Sil nexiste pas, elle passe lattribut suivant sans affecter de valeur. Sil existe, la valeur est extraite du tableau et affecte lattribut en cours de traitement. AJOUTCONSTR. Cette fonction permet dajouter une nouvelle structure contextuelle dune lexie (EltconstrMS) la superstructure dun mot qui contient toutes celles qui ont dj t repres et ajoutes prcdemment (EconstrMS). Autrement dit, elle permet lajout un lexme de toutes les informations qui permettent den diffrencier les emplois. La fonction ne sapplique quau mot source puisque la base est pralablement trie par ordre alphabtique du mot source et quon part dabord du principe quun mot cible nest prsent que dans une seul ligne par mot source (nous verrons que cela nest pas forcment le cas, et comment rsoudre le problme).
280

AJOUTLIEN. Cette fonction a pour but dajouter tout lien de synonymie nouvellement cr lensemble des liens de synonymie (Liens). Si le lien existe dj dans Liens241, il nest pas rimplant. AJOUTMOT. Ds quune structure contextuelle est cre, AJOUTMOT ajoute le lexme vis (Objdico) au dictionnaire (Dico). Si lentre existe dj, le programme se contente de ractualiser la superstructure Econstr de Objdico en vrifiant que la nouvelle structure contextuelle ny figurait pas dj242. Dans ce dernier cas, seul lindice de la structure Eltconstr est ajout la structure dj rpertorie dans lensemble. Bien que nous ne les ayons pas dtailles plus avant, les trois fonctions Ajouter ont le mme comportement face la redondance : avant dinclure llment vis lensemble o il doit apparatre, la fonction vrifie quil na pas dj t implant et ne lajoute que sil nexiste pas encore. En ce sens, la fonction Ajouter contient une fonction Rechercher, comme nous lavons annonc avant la prsentation de lalgorithme. 5.2.3.2 Les autres paramtres manipuls Nous allons prsenter ici les diffrents objets ncessaires pour lcriture de lalgorithme. Tout ce qui a t prsent prcdemment (par exemple les diffrents liens de synonymie) ne sera pas redtaill ici. Dico. Dico correspond au dictionnaire intgral qui concentre toutes les donnes mises en relation au moyen de lalgorithme. Il est le rsultat de la fonction principal EXTRACTDONNEES. Cest un ensemble de type Ensemble dobjets. Ensemble-dobjets. Comme son nom lindique, cest un ensemble dobjets et se dcompose en deux : la liste des superstructures de chaque mot (Objdico) et la liste des liens de synonymie (Liens). La runion de ces deux ensembles constitue le Dico.

241

En gnral les liens non orients sont construits deux fois par lalgorithme, une fois pas mot source. Ceci implique que la fonction sassure dabord que le lien nexiste pas encore avant de lajouter. 242 En thorie, ce cas de figure ne se rencontre jamais pour le mot source, une structure contextuelle ne pouvant correspondre qu une lexie, et donc une ligne. Dans la pratique, si un verbe peut tre traduit par plusieurs verbes de la langue cible dans des emplois identiques, la structure est rpte sur plusieurs lignes. Il faudrait donc le prvoir dans la dfinition de Ajoutmot.
281

Objdico. Objdico est un objet qui possde quatre paramtres qui correspondent pour les trois premiers aux critres de dgroupement propres chaque lexme : lemme, catgorie, langue (Lemme, Cat, Lang, qui sont des valeurs stables et prdfinies) ainsi qu lensemble des structures contextuelles possibles pour cette entre (Econstr, qui est construite par lalgorithme). Liens. Liens est un ensemble qui contient la totalit des liens de synonymie crs par lalgorithme et enregistrs aprs leur cration. Son paramtre est {lien}. Lien. Le lien de synonymie est constitu de trois paramtres : lindice qui renvoie la lexie vise du premier terme du lien, lindice qui renvoie la lexie du second terme et le type de synonymie dont il sagit (celui-ci est une constante et se note entre guillemets, ST , par exemple). Lorsquon interroge un lien de synonymie entre deux termes, lalgorithme renvoie directement aux lexies quivalentes grce aux indices. Econstr. Cest la liste des structures contextuelles Eltconstr (quelle a en paramtre) pour chaque lexme. Eltconstr. Llment de construction Eltconstr correspond une structure contextuelle dune lexie. Elle se constitue des informations linguistiques propres une lexie (constructions, collocations, registre, informations complmentaires) et galement dun indice identique aux liens de synonymie qui lui sont associs. La liste des Eltconstr dun lexme donn est contenue dans la superstructure Econstr. Numcons. Le compteur Numcons permet daffecter des indices chaque structure contextuelle et aux liens de synonymie qui vont avec. Il est incrment chaque utilisation. Indice. Les indices prennent la valeur de Numcons aprs chaque incrmentation et sont affects la structure contextuelle en cours de construction dans lalgorithme (de MS, MC, SMS ou SMC selon le cas).

5.2.4 Lalgorithme en langue naturelle : dtails et explications


prsent que nous avons pos et expliqu chaque ligne de lalgorithme ainsi que les fonctions et les objets qui nous ont servi llaborer, nous allons en faire la
282

description en langage naturel. Les explications qui vont suivre sont conformes la progression de lalgorithme et sont avant tout destines en expliciter certains points. Tout dabord et avant dentrer dans lalgorithme proprement dit, la base de donnes initiale existe sous forme dun tableau, chaque cellule tant par consquent caractrise par un indice de type lment de tableau deux paramtres TAB[i,j]. Le paramtre ncessaire pour lextraction est la base de donnes elle-mme, sous la forme dune page Excel. On peut supposer tort ou raison que la fonction de rcupration dune feuille de tableur est prdfinie dans la bibliothque de tout compilateur, au mme titre que pour les fichiers de type texte. Toutefois, mme si elle ne ltait pas, notre propos nest pas ici den prparer la programmation. La premire fonction appeler (EXTRACTDONNEES) est celle qui va extraire les donnes de la base, se prsentant donc pour nous sous forme de tableur, et les transformer en structures contextuelles. Autrement dit, il sagit de la fonction qui va exploiter les donnes de la base ligne par ligne. La fonction dextraction ncessite la dfinition dau moins trois autres ensembles de procdures : la transformation de la base de donnes en un tableau exploitable par la programmation (pas explicit ici puisque nous partons du principe quil sagit dune fonction prdfinie), la recherche de la prsence dlments dans une case (ExisteElment par exemple, notons que cette dernire nest pas indispensable en cas dappel ngatif du contenu dune case du tableau) et la construction des structures contextuelles, laquelle consiste en laffectation du contenu de la cellule du tableau qui lui correspond chacun des attributs dune lexie. Les fonctions de recherche ne posent pas de problme particulier, si ce nest dans lemplacement de chaque lment recherch. Dans cette optique, il ne faut pas oublier de prciser chaque tour de boucle lindice de la colonne o doit se trouver llment que lon recherche. Toutefois, cet indice est constant tout au long de la base, ce qui ne devrait pas poser le moindre problme de dtection ( un critre donn correspond un numro de colonne donn). La recherche de lexistence dun mot peut tre utilise dans la fonction qui transforme la base pour signifier quon ne remplit des cases mmoire quen cas de prsence dun objet au moins dans la cellule correspondante. Elle est galement utile - voire indispensable - pour dterminer sil y a lieu dassocier une structure une cellule ; sans cette condition, le programme crera des structures pour toutes les cellules vides et donc des structures vides et inutiles, mais demandeuses de mmoire. Dans lalgorithme, la fonction de recherche est absorbe, et ce doublement : par les fonctions AJOUT car nous avons dcid que dans le fonctionnement interne de celles-ci, il est prvu que llment sera recherch avant dtre joint lensemble correspondant ;

283

par laffectation des valeurs aux attributs qui constituent les structures contextuelles. La fonction EXTRACT est conue pour dabord rechercher une case non vide avant dautoriser lexistence de lattribut. Aprs la dclaration des fonctions et des ensembles que nous avons dfinis un peu plus haut, les premires oprations de lalgorithme sont linitialisation du dictionnaire (Dico) et de lensemble des liens (Liens), la mise en position la ligne 1 du tableau, laffectation au mot source et la langue source de leurs valeurs respectives (sans fonction EXTRACT car Motsource et LS sont toujours renseigns dans le tableau) et linitialisation du compteur Numcons qui va nous servir pour affecter des indices chaque lment construit par lalgorithme, quil sagisse des structures des lexies ou des liens de synonymie. Une fois que tout est initialis, la procdure dextraction et de mise en relation des informations peut commencer. Lalgorithme est rgi par deux boucles de type tant que qui autorisent les oprations se drouler jusqu ce quil ny ait plus de donnes traiter dans le tableau : La premire boucle principale concerne le tableau tout entier, elle stipule que tant quune ligne du tableau contient des informations, et avant toute chose tant que la cellule Motsource contient une valeur non nulle, les lignes qui suivent sont actives ; autrement dit, on sarrte ds que le parcours de lalgorithme rencontre une ligne vide ou plus exactement une cellule Motsource vide. lintrieur de cette boucle principale, lensemble des structures contextuelles est initialis pour chaque lexme trait. Encore une fois, nous insistons sur le fait que le tableau est pralablement class par ordre alphabtique pour autoriser cette procdure. La seconde boucle contenue dans la premire se rapporte chaque terme, ce qui suppose donc que nous traitons les entres une par une en position de Motsource. Elle stipule que tant que le mot source et la langue source de la ligne en cours de traitement sont identiques au mot source et la langue source de la ligne prcdente243, on effectue les oprations qui suivent jusquau renvoi au dbut de la boucle .

243

Ce faisant, on se prmunit du fait quune seule graphie peut tre commune des entres de langues diffrentes. Les deux paramtres sont donc ncessaires pour viter que lalgorithme nassocie pour le mme mot des structures contextuelles de langues diffrentes (par exemple, les verbes franais et espagnol salir qui ont la mme graphie et la mme catgorie grammaticale pour le lemme de rfrence et quil faut par consquent distinguer lun de lautre par la langue).
284

Ceci tant pos, on effectue lincrmentation du compteur Numcons et laffectation de sa nouvelle valeur au mot source via IndiceMS, celui-ci restant constant pour une lexie donne (i.e. la fois pour la structure unique dune lexie et pour tous les liens de synonymie quelle gnre). Ce compteur sera incrment chaque fois quil faudra donner un indice de rfrence une lexie quel quen soit le type (MC, SMS et SMC inclus). Grce cela, on ne retrouvera jamais dans Dico deux lexies diffrentes avec le mme indice, ce qui facilitera la recherche dinformations pour lutilisateur lappel du programme. Dans la grande majorit des cas, une ligne du tableau contient au moins un mot source et un mot cible. Pour la suite de cette description, nous considrerons ce principe comme constant244. La premire opration dextraction de donnes consiste en la fabrication de la structure contextuelle du mot source dans la ligne considre. Pour ce faire, on affecte cette structure EltconstrMS les couples attribut-valeur suivants : Constructioncontenu de la case 10 , Collocation objet 1-contenu de la case 7 et ainsi de suite pour les autres critres retenus, collocation objet 2, registre et informations complmentaires. Il faut noter que EltconstrMS contient galement en valeur lindice qui a t affect MS, sans quoi on ne pourrait pas rcuprer cette structure contextuelle ultrieurement. Sils existent, le mot cible, la langue cible (qui vont ncessairement de pair), le synonyme en langue source et le synonyme en langue cible prennent comme valeur le contenu de la case o ils apparaissent normalement. Sil ny en a pas dans la ligne traite, la fonction EXTRACT a pour mission de les ignorer et de renvoyer une valeur nulle qui entrane incessamment la suite des oprations. Il est noter que la prsence dun MC ne prjuge pas de la prsence dun SMS ou dun SMC. En revanche, ds quil y a un SMC, il y a forcment un MC. Il ny a pas besoin de rcuprer linformation concernant la langue pour les deux synonymes ventuels car celle-ci est identique celle de MS ou de MC. De ce fait, linformation sera simplement rcupre par le biais de la superstructure de SMS et de SMC en fin dalgorithme. Sil y a un mot cible, donc le cas le plus frquent, lindice est dabord incrment pour tre diffrenci de lindice du MS, puis on effectue la construction de la structure contextuelle de MC qui correspond la lexie de MS. En ltat de notre base de donnes, MS et MC partagent les mmes informations sils apparaissent sur la mme ligne, sauf en ce qui concerne la partie construction qui est justement destine montrer des diffrences syntaxiques entre les deux langues mises en rapport. Ainsi, les collocations, le registre et les informations complmentaires sont valables aussi bien

244

Par lintermdiaire de plusieurs sources (synonymes de la mme langue, analyses linguistiques des chapitres III et IV), nous avons suggr denrichir la base par des donnes qui nont pas de lien avec la traduction. Ce cas de figure nest pas pris en compte dans notre algorithme principal mais le sera en conclusion ce chapitre. Pour linstant, nous ne nous intressons quaux cas de traduction relle .
285

pour la lexie source que pour celle qui la traduit245. Ds quelle est cre, la structure contextuelle du mot source EltconstrMC est ajoute la superstructure de MC EconstrMC. La prsence dun lment MC dans la base indique quil sagit dune traduction de MS, ce qui induit la cration dun lien de synonymie de type synonyme de traduction (ST) qui est immdiatement ajout la liste des liens grce la fonction Ajoutlien, pour laquelle nous rappelons quelle commence par vrifier que le nouveau lien implanter nexiste pas dj. Comme nous lavons prcis pour cette fonction, un lien nouveau est constitu de trois paramtres : les indices de chaque lexie (se rapportant leurs structures contextuelles) et le type du lien dont il sagit (en loccurrence ST). Enfin, lentre MC est ajoute Dico sous la forme de Objdico. Comme pour les autres ajouts, lentre est cre si elle nexiste pas encore ; si elle existe dj, la fonction AJOUT se contente de vrifier si la construction Constr qui vient dtre formate existe elle aussi, et ly ajoute seulement si elle est dj rpertorie lidentique. Si cet Constr existait dj dans lObjdico se rapportant MC, seul les indices des EltconstrMC sont reports dans Objdico. Toujours lintrieur de la seconde boucle, il reste traiter les synonymes LS et LC dont la frquence dapparition nest pas trs leve mais est loin dtre ngligeable. Quatre cas de figure se prsentent sous conditions : soit il ny a ni SMS ni SMC, auquel cas les procdures conditionnelles sont ignores (si non-SMS alors on passe, si non-SMC alors on passe) ; soit il y a un SMS et pas de SMC. SMS subit alors les mmes oprations que MS et MC prcdemment avec quelques adaptations : le SMS reoit son tour un indice diffrent des prcdents, on construit son Eltconstr qui ne contient pas dautre information que lindice, on ajoute les liens de synonymie induits par la prsence dun SMS et lentre du SMS est cre par AJOUT sur le mme modle que MS et MC246 ; soit il y a un SMC et pas de SMS. Ce que nous venons de dcrire pour SMS est appliqu SMC ;

245

Nous admettons ce principe pour une criture simplifie de lalgorithme et de la base de donnes, mais nous admettons plus encore que le principe ne peut pas tre valable dans tous les cas de figure. 246 Nous faisons remarquer que cest essentiellement lindice qui est report dans Dico, et non pas les informations linguistiques ventuellement lies au SMS dans un contexte prcis, celles-ci faisant lobjet dun traitement part lors de la prsence du mme lemme en position MS dans dautre lignes de la base de donnes.
286

soit les deux sont prsents. Aux commandes ci-dessus, effectues dans lordre tabli, on ajoute simplement le lien de synonymie indirecte (SI) qui caractrise dans notre typologie la relation entre un synonyme langue source et un synonyme langue cible. Une fois que les oprations conditionnelles ont t passes en revue, il ne reste plus qu effectuer les dernires oprations denrichissement du dictionnaire, savoir lajout EconstrMS de la structure contextuelle de MS, laquelle na pas encore t adjointe la superstructure de MS. Cette dernire opration, avant lincrmentation de la ligne, permet de stocker sous un mme lemme lensemble des informations relatives chaque lexie. Comme nous lavons dj dit, la superstructure fonctionne comme un ensemble dobjets structurs, ce qui donne par exemple pour un lemme quelconque : (lemme = Cat = V Lang = A Constrelementlangue = {(Typeconstr = MonotransD); Objet1 = [x1], [x2], [xn] ; Objet2 = * Sujet = *247 ; Registre = * ; Infoscompls = ) ; Constrelementlangue = {(Typeconstr = BitransDI; Objet1 = * ; Objet2 = [x1], [x2], [xn] ; Sujet = * ; Registre = * ; Infoscompls = []) ; etc.} En rsum, la fonction EXTRACTDONNEES extrait les lments de chaque cellule, elle les formate comme valeur dattributs (en fonction du deuxime paramtre du tableau, celui qui correspond la colonne) et enfin cre des couples attribut-valeur formats qui vont se placer dans les ensembles auxquels on les fait appartenir. Toutes ces oprations seffectuent au sein dune boucle dont la condition darrt correspond larrive en fin de ligne du tableau (une ligne = une lexie dans la base de donnes). Ensuite, on rpte lopration tant quil y a des lignes non formates dans la base, jusqu la fin de la boucle principale qui dit que tant quune ligne contient des informations, on rpte les oprations .
247

On fait correspondre ici le signe * un lment quelconque par opposition [] qui est lensemble vide.
287

Pour chaque ligne, lalgorithme cre jusqu quatre structures contextuelles (selon le nombre de lexies prsentes), enrichit autant de superstructures en crant ventuellement les entres concernes, implante tous les liens de synonymie toujours en fonction du nombre et du type de lexies prsentes, et enfin renvoie le tout muni dindices de reprage dans le dictionnaire principal. Et ce jusqu ce quon parvienne au bout de la base de donnes. Il faut noter que pour n langues implantes dans le graphe, il faut utiliser les donnes de factoriel-n dictionnaires. Cela tant, il y a possibilit de transformer les CSMU une fois programms en dictionnaires bilingues avec nimporte quelle correspondance, en vertu du fait que chaque objet structur est muni de son tiquette de langue.

5.2.5 Quelques ajouts facilement envisageables


Pour des raisons purement didactiques, la proposition que nous avons faite se rsume un algorithme simple qui tient compte du plus petit nombre de contraintes possible qui pseraient sur le processus de transfert interlangue. Au demeurant, nous pouvons citer dores et dj quelques points pour lesquels un amnagement immdiat de la base de donnes et/ou de lalgorithme est facilement envisageable. Pour commencer en ce qui concerne les donnes, la solution de rendre communes aux deux langues mises en rapport les informations smantiques et argumentales nest videmment pas suffisante dans loptique dun systme oprationnel en aide la traduction. Chacun des critres que nous avons retenus pourrait donner lieu de nouvelles formes de traitement au sein du tableau de donnes : tant donn que nous navons pas projet dassocier nos travaux un analyseur syntaxique pour chaque langue, nous ne remettrons pas en cause le dgroupement des colonnes Constr en deux, une pour le mot source, une pour le mot cible. Toutefois, la forme initiale de nos cellules ne permet pas premire vue de traiter les constructions vraiment diffrentes dune langue lautre. Lunification des collocations sujet et objet pour les deux langues confrontes pose un petit problme dontologie et de traduction lintrieur de lontologie. En effet, une collocation nest pas traduite de faon systmatique dans les dictionnaires. Encore plus embtant est la diffrence de traitement entre les collocations : soit la collocation est ontologique et napparat quen langue cible, soit elle est intgre la phrase exemple et est visible dans ce cas dans les deux langues. Le
288

statut de la collocation nest dailleurs pas le mme dans ces deux cas de figure ; dans le premier, il y a une insistance sur la prsence obligatoire dune collocation et sur son appartenance ncessaire un paradigme lexical (non explicite), et dans le second la phrase exemple est l surtout pour prciser lacception qui donne lieu la traduction sans quil y ait dinsistance relle sur la collocation elle-mme. Le registre et les informations complmentaires vhiculent des informations disparates qui nont pas toutes le mme degr dappartenance aux deux langues en rapport. Lorsquil sagit de terminologie, technolecte et domaine demploi spcifique, linformation est sans problme commune aux deux. En revanche, les parlers nationaux ou rgionaux, les niveaux de langue et certains prolongements de sens (souvent propres une seule des deux lexies) ne peuvent subir lunification interlangue sans tre vrifies au pralable. Dans presque tous les cas, nous pouvons envisager de doubler les colonnes afin de faire correspondre chaque lexie son propre paradigme dinformations linguistiques. Les modifications reporter dans lalgorithme seraient mineures dans ce cas de figure ; il sagit avant tout de savoir o vont se placer les informations nouvellement encodes et quels seraient leurs indices. En tout tat de cause, lalourdissement de la base de donnes peut tre tempr par lusage de dictionnaires lectroniques entirement baliss, avec des balises de langues susceptibles disoler des informations qui ne concernent quune seule des langues. Concernant lalgorithme, quelques ajouts peuvent tre effectus rapidement sans gner la structure que nous lui avons donne. Tout dabord, dans le cadre de la saisie des donnes relatives la synonymie intralangue aussi bien qu lanalyse linguistique monolingue, il ne faut pas ignorer les cas o linformation mot source nest pas renseigne dans un certain nombre de lignes, moins de faire bnficier ces lignes dun traitement part (sous la forme dun sousalgorithme qui ne traiteraient que la construction de structures contextuelles et de liens synonymiques en langue source). Les deux solutions sont intgrables notre algorithme, soit en considrant que nous faisons fonctionner part la sous-base de donnes qui ne contient pas de parcours de traduction, soit en intgrant des procdures conditionnelles avant de traiter les MC. Cest cette dernire solution que nous allons dcrire maintenant. lintrieur de la deuxime boucle de lalgorithme, nous intgrons la condition si MC existe alors nous crons sa structure contextuelle et le(s) liens qui vont avec . Mais comme les prsences de SMS et de SMC ne sont pas garanties non plus, il faudra rpter plusieurs procdures conditionnelles, Si MC et SMS existent , si MC et SMC existent et si MC, SMS et SMC existent . Notons que nous pouvons
289

intgrer le traitement des lignes sans traduction lintrieur de la premire condition car sil ny a pas de MC, cest que nous traitons uniquement un synonyme en langue source (donc un SMS) ou une simple structure contextuelle du MS (sans renvoi synonymique).
EltconstrMS = (Constr = EXTRACT (TAB[ligne,10]), Collocobjet1 = EXTRACT (TAB [ligne, 7]), Collocobjet2 = EXTRACT (TAB [ligne, 8]) , Collocsuj = EXTRACT (TAB [ligne, 9]), Registre = EXTRACT (TAB [ligne, 12]), Infoscompls = EXTRACT (TAB [ligne, 13]), IndiceMS) ; MC = EXTRACT (TAB[ligne, 3]) ; LC = EXTRACT (TAB[ligne, 4]) ; SMC = EXTRACT (TAB[ligne, 6]) ; SMS = EXTRACT (TAB[ligne, 5]) ;

si MC .NE. ^ alors dbut


IndiceMC = Numcons ; Numcons = Numcons + 1 ; EltconstrMC = (Constr = EXTRACT (TAB[ligne,11]), Collocobjet1 = EXTRACT (TAB [ligne, 7]), Collocobjet2 = EXTRACT (TAB [ligne, 8]) , Collocsuj = EXTRACT (TAB [ligne, 9]), Registre = EXTRACT (TAB [ligne, 12]), Infoscompls = EXTRACT (TAB [ligne, 13]), IndiceMC) ; EconstrMC = {EltconstrMC} ; AJOUTLIEN (Liens, (IndiceMS, IndiceMC, ST ) ; Objdico = (Lemme = MC ; Cat = V ; Lang = LC ; Constr = EconstrMC) ; Dico = AJOUT (Dico, Objdico) ;

sinon si SMS .NE. ^ alors dbut etc. sinon continuer si SMS .NE. ^ alors dbut etc. 5.3 Atouts et perspectives
lheure de faire le bilan des recherches que nous avons menes dans le cadre de cette thse, il est dabord indispensable de nous pencher sur ce que les modles et lalgorithme que nous dfendons peuvent rellement apporter la linguistique et en particulier au domaine de la traduction assiste par ordinateur. Bien que nous soyons parfaitement conscients des manques et insuffisances de notre travail lis la complexit de chaque langue et plus encore de leur
290

interconnexion asymtrique, nous avons souhait montrer quun dictionnaire multilingue entirement paramtr pouvait tre gnr de manire entirement automatique par lintermdiaire de lalgorithme et des amliorations qui pourront lui tre apportes. Notre objectif initial tait la reprsentation de lexiques de plusieurs langues au sein dun mme graphe. Au final, nous proposons une mthodologie qui permet non seulement de construire ce graphe mais galement daboutir un mode de reprsentation des donnes intermdiaire entre des dictionnaires dits et des lexiques lectroniques paramtrables. Les bases de donnes construites lappui de notre mthodologie doivent autoriser aussi bien leur transformation en un format lexicographique traditionnel, constituant en cela une mmoire de traduction reproduisant fidlement et exhaustivement les donnes de plusieurs dictionnaires de rfrence, que le passage un format lectronique avec possibilit de gnrer une aide la traduction efficace. Outre son format intermdiaire, ce qui ne signifie pas quil nappartient ni lun ni lautre des formats papier et lectronique, la base de donnes reste ouverte et ce deux niveaux : toute nouvelle information peut tre ajoute (ou retire) tout moment (ligne horizontale) et un nouveau critre gnral peut tre insr sans problme (ligne verticale). Dans ce dernier cas, lapparition dun critre gnrique devra tre rpercute dans le programme qui viendra lappui de notre algorithme, celui-ci tant conu pour tre le plus volutif possible. Les deux plus grands atouts de notre travail sont notre avis la simplicit et la mallabilit. En effet, il ny a rien de plus trivial quune base de donnes ordonne qui intgre lensemble des lexies de toutes les langues ; lalgorithme lui-mme rpercute cette simplicit apparente dans son mode de fonctionnement, en exploitant les donnes ligne par ligne sans se soucier de subtilits - pour linstant qui ne rentreraient pas dans les cases prvues. Du ct de la mallabilit, nous avons dj insist sur le fait que la base et lalgorithme sont tous les deux conus pour recevoir des critres et des amnagements ultrieurs. Bien entendu, il faudra veiller lheure de programmer que nos vellits damlioration constante ne se heurtent pas la complexit de la programmation et ne mnent pas la pratique du pansement qui consiste bidouiller un sous-programme lendroit adquat plutt que dintgrer les nouvelles informations au bon endroit. Compte tenu de la forme actuelle de notre algorithme, ce dernier point ne suscite pas chez nous de relle inquitude.

291

CHAPITRE V

Conclusion Bilan final, Perspectives et Obstacles

292

1. Rappel des objectifs et des rsultats


Pour atteindre lobjectif que nous nous tions fix au dpart, savoir proposer une mthodologie permettant de transformer des bases de donnes bilingues en un graphe multilingue informatis, nous avons effectu quatre tapes principales : transformation des donnes issues de dictionnaires bilingues et de dictionnaires de synonymes en une base de donnes multilingue ; prise en compte des donnes issues de corpus et rflexion sur la faon dextraire et de reprsenter les informations susceptibles davoir de linfluence sur une traduction ventuelle ; runion dans la mesure du possible des deux ensembles de donnes, lexicographiques et littraires, au sein dune base unique ; criture dun algorithme pour un programme informatique capable de transformer la base de donnes finale en un graphe multilingue complet o tous les liens lexicaux prsents dans la base sont reproduits. Ce programme doit servir de base au passage du graphe ou de la BD au format lexicographique traditionnel ou au contraire au format lectronique paramtrable. Le principal attrait de nos modles est double : runir toutes les informations entre langues dans un mme modle de reprsentation et induire une collaboration tacite de la part de lutilisateur dun tel lexique, en lui proposant automatiquement et de manire ordonne toutes les traductions envisageables dans un contexte prcis. Notre problmatique dorigine ne comprenait que lexploitation des dictionnaires dits mais nous avons rapidement pris conscience que la ralit de la langue en contexte nen dpendait gure autrement quen sen servant comme point de dpart la cration originale de sens et de structures, dautant que les dictionnaires ne sont que le reflet de la langue et ne prcdent pour ainsi dire jamais lapparition de nouveaux sens. Sur ce dernier point, il est manifeste que les auteurs littraires, et dans une moindre mesure les journalistes, sont les plus grands pourvoyeurs publics de sens nouveaux gnralement mtaphoriques, ou de constructions syntaxiques nouvelles qui sadaptent des sens dj connus. Notre base de donnes lexicale intgre ces dernires sans adaptation ncessaire dans la mesure o une lexie est implante avec toutes les informations quelle vhicule explicitement mais ne ncessite pas quon lui associe demble une ou plusieurs traductions dans une langue cible. Ce dernier travail peut tre purement collaboratif grce la participation et la validation des utilisateurs partir de leur propre connaissance de la langue.
293

Dun point de vue pratique, la programmation dun systme de transformation de la base de donnes en graphe synonymique ne pose pas de problme (cf. algorithme). Nous pouvons annoncer que le programme de cration de graphes a t crit lATILF par tienne Petitjean directement partir de notre algorithme et quil est dores et dj oprationnel pour des exprimentations futures. Au-del de ce rsultat concret, il nous reste prciser un certain nombre de points dans loptique de poursuivre le projet, et en particulier nous devons nous pencher sur la question des liens indirects qui ne sauraient tre gnrs automatiquement sans laval dun utilisateur expriment. Cest donc la principale difficult de notre modlisation : comment qualifier et caractriser les liens de synonymie (ou autres) qui ne sont pas directement apparents dans le graphe ? Quels sont les moyens mettre en uvre pour activer les liens invisibles ? ces questions nous navons rpondu que partiellement car nous navons pas les outils thoriques ni la visibilit dont nous aurions besoin pour une application de qualit constante. Toutes les exprimentations de liens indirects que nous avons tentes mnent une seule et mme conclusion : tout lien qui ne serait pas directement perceptible par les dictionnaires ou les corpus doit ncessairement tre valid par un utilisateur avis. En ltat actuel des choses, les fameux liens invisibles ne pourraient tre valus quau cas par cas, ce que nous avons refus de faire compte tenu du temps que prennent et quont pris dj les autres analyses linguistiques et la cration de nos bases. Cet aveu dchec provisoire nexclut pas nanmoins que nous reprenions la problmatique pour un prolongement utile et efficace de nos graphes, bien au contraire, dautant que cette rflexion sera de toute faon indispensable si nous avons la chance de continuer cette recherche.

2. Contribution pour le dictionnaire du XXIme sicle


Lorsque nous songeons au lien qui unit dictionnaire et graphe, nous pensons quun dictionnaire contient toutes les donnes ncessaires pour construire un graphe smantique. Les CSMU dont nous avons pos les principes sont lorigine entirement conus partir du matriau lexicographique. Aucune donne utile la discrimination lexicale nest ignore, de mme quaucune information superflue nest initialement prsente. Les CSMU se posent donc dabord en reflet absolument fidle dun outil textuel prexistant sa cration, hors de tout arbitraire de la part du programmeur. Comme nous le suggrons en sous-titre, un dictionnaire contient toutes les donnes ncessaires pour construire un graphe smantique. Certes, la formule fonctionnerait tout aussi bien pour dire quun dictionnaire de correspondance directe, comme un dictionnaire de synonymes non comment, se suffit dj lui-mme dans la perspective de btir un graphe. Ce que nous voulons vraiment exprimer est quil ne devrait pas y avoir de limitation dans limplantation des critres destins faciliter ou expliciter le passage dune langue une autre. Autrement dit, ds lors quune
294

information linguistique est juge pertinente en traduction, nous devrions pouvoir lexploiter et la reprsenter. Cest tout lenjeu de la collaboration entre la linguistique de corpus que nous avons mise en avant et la lexicographie dite. Au-del de ce simple constat, nous devons galement songer aux complments apporter aux CSMU pour englober un dictionnaire dans son intgralit. Les donnes que nous navons pas prises en compte, mais qui figurent dans les dictionnaires bilingues en tant quinformations pertinentes, peuvent tre facilement ajoutes nos bases de donnes moyennant linsertion de nouvelles colonnes. Il sagit notamment de la forme phontique de lentre (dans le Robert & Collins), de certains indicateurs de dgroupement neutraliss par la forme linaire et squentielle de nos bases, etc. Rien ninterdit de les intgrer une base de donnes complte et ensuite de moduler le programme dextraction des donnes selon les besoins. Ce que nous envisagerions dans lidal serait lcriture de plusieurs programmes parfaitement distincts partir du mme algorithme modulable, un programme pour la cration des CSMU tel que nous lavons annonc, un programme pour simplement extraire un fragment des CSMU (et dans ce cas paramtrable la main grce des menus informatiss) et galement un programme qui prenne la totalit des informations de la base de donnes pour en faire un dictionnaire absolument complet sans filtre de la connaissance dj saisie. La base de donnes est ainsi prendre comme le rsultat de lalgorithme appliqu au dictionnaire. En tendant avec enthousiasme la porte de notre algorithme de cration de graphes, rien nempche dimaginer que celui-ci sera capable de transformer directement le dictionnaire (dans sa forme lectronique) en cette mme base. Cest dailleurs la motivation profonde du travail que nous dfendons. Cela suppose videmment que lon puisse disposer dun dictionnaire entirement lectronique, et balis qui plus est. La reconnaissance de chaque balise, correspondant un type dinformations et un seul, peut tre aisment repre et intgre sa place dans le tableur. Dune certaine faon, lalgorithme que nous avons crit est un baliseur mais ce nest pas suffisant. Ce que nous souhaitons, mais nous ne pouvons que lappeler de nos vux, est que nous puissions exploiter des dictionnaires dj baliss pour les transformer automatiquement en base de donnes. Si une telle chose tait possible, nous nous ferions une joie dcrire lalgorithme pralable lapplication de notre algorithme principal. Malheureusement, il est fort peu probable que nous aurons un jour laccs aux sources et aux balises caches des dictionnaires commerciaux moins denvisager une collaboration directe avec les diteurs. Du coup, notre travail sinscrit avant tout dans une perspective purement mthodologique et verra ses premiers aboutissements et sa premire confirmation dans lexprimentation manuelle, cest--dire en crivant nousmme notre base. Pour linstant, plusieurs milliers de lexies y ont t implantes par nos soins mais elles ne reprsentent quune infime partie de tout ce qui est prsent dans un seul dictionnaire. Toutefois, la solution de baliser nous-mme un dictionnaire numris demeure envisageable dans la mesure o les formats typographiques diffrent selon ce que les
295

champs dsignent lintrieur de louvrage. Hlas, dans certaines ditions, lidentification des champs est rigoureusement impossible de manire automatique car les formats typographiques ne sont pas clairement diffrencis (cas des ditions Larousse et Bordas voqus au chapitre II). En ce qui concerne le Robert & Collins, ce travail dautomatisation en aval est peut-tre plus ais mais se heurtera nanmoins la concurrence occasionnelle de plusieurs critres pour une mme typographie. Par consquent, lexprience mrite dtre tente mais nous nesprons pas une automatisation intgrale de ce type de balisage par nos soins, tout le moins pas sans une vrification systmatique des champs concurrents. Il reste que lopration ne pose aucun problme sur le plan thorique : tout dictionnaire entirement balis est directement exploitable moyennant lalgorithme adapt, et tout dictionnaire nutilisant quune seule typographie par champ peut tre facilement balis par un simple programme de conversion. Dans la ligne des lexiques miroirs dont nous avons imagin la reprsentation et dcrit le fonctionnement, partons du principe que nous sommes capables de gnrer entirement une base de donnes lexicale et son graphe de reprsentation partir dun simple dictionnaire, sans autre outillage que lalgorithme de cration des CSMU. Par extension, rien ne semble sopposer ce que cet algorithme soit invers pour gnrer un dictionnaire complet partir des bases. Toujours en partant de lhypothse que les CSMU pourraient t conues partir dun matriau textuel balis, les graphes que nous envisageons garderaient, dans les faits ou potentiellement, la trace de ces balises de sorte que leur restitution inverse soit immdiate. Encore une fois, cest le principe du miroir que nous appliquons pour retourner au matriau dorigine, le dictionnaire en tant que tel. Dans la mesure o nous intgrons des donnes de sources multiples, le dictionnaire restitu serait donc dune richesse trs suprieure ce que chacun recelait au dpart. Le procd dinversion de lalgorithme permettant de restituer, lidentique ou de manire fusionne, les donnes prsentes dans un dictionnaire bilingue dorigine, nous pouvons ainsi imaginer ce que cela pourrait apporter la lexicographie en gain de temps et de lisibilit. Le lexique miroir et son corollaire base de donnes prsentent la particularit de proposer la fusion des deux parties dun dictionnaire bilingue sans toutefois limposer ; tout dpend de la partie de lalgorithme qui est active. Ce dernier point prsuppose que lalgorithme ft complt par cette potentialit de fusion des donnes, chose assez facile ajouter en dsorientant le graphe, comme nous lavons dj expliqu. Lun des avantages des bases issues du dictionnaire est de pouvoir tre enrichies, appauvries ou modifies loisir. Par lvolution de la langue ou par dcision des lexicologues, toute information lacunaire ou obsolte peut tout instant tre
296

ajoute ou te. Consquemment, le nouveau graphe est recalcul par le passage du mme algorithme de construction sur la base modifie. On imagine sans peine ce que cette mthode pourrait apporter en gain de temps aux rdacteurs de dictionnaires : un ouvrage entier sous la forme dun ensemble de lignes, chacune de celles-ci correspondant une lexie ou plus prcisment un emploi prcis donnant lieu une traduction spcifique. Ds lors, si la base est suffisamment complte pour embrasser tout louvrage lexicographique, sa rdition serait la simple rvaluation du graphe partir des modifications quon aura fait subir celle-l. Une fois encore, nous nous heurtons lopacit parfaitement comprhensible des concepteurs de dictionnaires industriels en la matire. En effet, il est tout fait possible quune partie de notre mthodologie, et en particulier de celle qui sous-tend la cration des CSMU, ft dj exploite par les maisons ddition. Mais sur ce point, nous ne pouvons hlas que supputer. Nous venons de le dire, il est difficile darriver savoir comment travaillent les rdacteurs vise commerciale ; on noffre pas facilement ses mthodes de travail en ce milieu. Il nous parat nanmoins probable que les donnes sont stockes numriquement dune anne sur lautre et que les modifications que les lexicographes leur font subir sont directement transmises sous la forme informatique. Il nous semble galement plausible quaucune base linaire telle que la notre nexiste pas dans le monde industriel, hormis lexemple remarquable du DI de Dominique Dutoit (cf. chapitre I) dont le principe de rvaluation-algorithmervaluation-etc. est nettement conforme notre orientation de recherche, mme si nous essayons de faire intervenir notre arbitraire le moins souvent possible. Devant toutes ces hypothses sur les mthodes de travail de chacun et en labsence de visibilit en ce domaine, nous ne pouvons quesprer que le travail que nous avons effectu est simplement original dfaut dtre directement exploitable, et quil sera possible den tenter lapplication pour mesurer son impact sur le dictionnaire idal dont nous rvons tous, celui qui contient tout et qui rpond toutes les questions. Bien sr, compte tenu de lvolution rapide de toutes les langues, cela nest pas gagn.

3. Des difficults en grand nombre


La polysmie, la synonymie, la terminologie lexicologique et toutes les notions que nous avons traites au cours de nos travaux nont pas eu la vie facile et ne nous lont pas rendu de mme. De toute vidence, nous ne parvenons un consensus terminologique qu partir du moment o nous figeons toutes les notions lintrieur de la mthodologie de construction des CSMU. Si elle na pas ou navait pas dj t effectue, lentreprise de saisie des donnes intgrales dun dictionnaire reprsente un travail monumental que nous
297

sommes trs loin davoir pu mener terme au-del dun seul lexme, lequel correspond dj plusieurs milliers de lignes (pour abandonner). Et encore, nous nous sommes content den proposer la sphre dinfluence smantique en restreignant autant que faire se peut lensemble des composantes de son graphe dans la limite des contraintes que nous avons tablies au cours de ce travail. La tentation daller explorer les bases littraires pour en extraire du jus dacceptions nouvelles a entran ce que nous appelons la double peur du vide . Tout dabord, sintresser au contexte, et donc au corpus, est une manifestation de langoisse qui nous anime face aux simples donnes non actualises. La question est largement dbattue depuis plusieurs annes et la polmique ne sest pas encore essouffle. Ensuite, une fois que la premire peur a t surmonte par lobservation des donnes attestes, une prise en compte large et systmatique de ces donnes se heurte immanquablement lcueil de leur exploitation par une application informatise. Il existe deux principaux obstacles relativement faciles reprer, beaucoup plus malaiss dpasser. En premier lieu, la crativit langagire des auteurs dpasse de loin ce que les dictionnaires proposent. Il est noter que ces derniers ne font jamais de prospection, se contentant par ncessit de reflter lusage. Lmergence trs rcente de dictionnaires plus personnels dauteurs littraires, de linguistes ou damuseurs tient plus du divertissement que dune vritable volont de renseigner sur la langue. Nous pouvons rappeler ce sujet que Grevisse en fait une critique froce dans son manuel. Dautre part, il nest plus possible dignorer la crativit massive issue des donnes de la toile Internet, laquelle subit des processus de cration certes anarchiques mais tout aussi rels que tout ce que nous avons observ dans dautres ensembles de donnes. Ensuite, le dcalage entre le sens encod et linterprtation est parfois difficile surmonter. En effet, il nous est arriv plusieurs reprises de ne pas savoir comment interprter un nonc tir de Frantext, comme par exemple certains exemples de mtaphore mentale avec traverser, sujet bien pineux effleur au chapitre III. En labsence de lindispensable commentaire de lauteur sur ses intentions lexicosmantiques, il nest pas possible de faire sa place le travail de dsignation dune nouvelle acception. De ce point de vue, larbitraire des exemples construits peut rassurer le linguiste lexicologue car celui-ci est sr du sens des noncs quil a lui-mme produits avec une finalit prcise. Il lui reste simplement convaincre le reste de la communaut du bien-fond de ses crations. Il existe des formes langagires qui ne sont pas des verbes au sens grammatical mais qui fonctionnent comme des prdicats verbaux dun point de vue smantique. Le cas des locutions verbales a dj t trait dans cette thse, nous ny reviendrons pas. En revanche, nous avons ignor les cas des substantifs dverbaux dont le discours est particulirement riche. En marge de lanalyse des verbes de parole que nous avons
298

tente au sein du PDR ILF Transitivit , nous navons pas explor la productivit des substantifs qui jouent le rle de prdicats de production de parole. Cela nempche pas ces noms davoir une productivit smantique et structurelle comparable celle de leurs quivalents verbaux et nous ne pourrons pas les ignorer bien longtemps si nous poursuivons notre travail au-del de ce que nous avons dj accompli.

4. Conclusion finale
Nous navons parl dans cette thse que de la catgorie verbale. Il est bien entendu quun dictionnaire lectronique complet ne saurait contenir que les lments de cette catgorie sans prsenter de fcheuses lacunes. Cest pourquoi la mthodologie de cration des CSMU devra tre augmente et enrichie par ltude des autres catgories grammaticales, chacune dentre elles avec les caractristiques qui lui sont propres. En plus de tous les prolongements que nous entrevoyons nos recherches en cours, ce dernier point est sans doute le plus important si nous assumons notre dsir de participer llaboration dun vritable dictionnaire du futur . De nombreux facteurs de dtermination des emplois et des traductions sont ncessaires et ont t volontairement simplifis dans notre travail, linstar de la ncessaire vulgarisation induite par lcriture des dictionnaires de langues. Rien ne nous oblige cependant pousser cette vulgarisation jusqu lignorance volontaire de tel ou tel critre linguistique apparemment peu pertinent. Toujours dans lespoir de contribuer btir un dictionnaire idal, nous esprons parvenir la modlisation du plus grand nombre de critres quil se pourra dsigner. Enfin, comme promis en introduction ce document, nous rappelons toute limportance que nous attachons la vision globale du travail linguistique et en particulier pour ce qui concerne la smantique lexicale : dictionnaires et corpus doivent pouvoir cohabiter dans le vaste monde des lexiques informatiss. La gnralisation de notre mthodologie toute source de donnes lexicales est dornavant lobjectif majeur que nous nous fixons pour la poursuite du projet.

299

Glossaire Glossaire des acronymes


CSMU : Champs Smantiques Multilingues Unifis. Dfinition pages 230 et suivantes. DI : Dictionnaire Intgral. Dfinition page 74. LC : Langue Cible LD : Lexique Droit. Dfinition page 11. LI : Lexique(s) Invers(s). Dfinition page 11 et 98. LS : Langue Source MC : Mot Cible MS : Mot Source SA : Synonymie Absolue. Dfinition page 244. SD : Synonymie Directe. Dfinition page 242. SI : Synonymie Indirecte. Dfinition page 244. SMC : Synonyme du Mot Cible SMS : Synonyme du Mot Source SPS : Synonymie Partielle en langue Source. Dfinition page 243. SPTC : Synonymie Partielle de Traduction en langue Cible. Dfinition page 243. ST : Synonymie de Traduction. Dfinition page 242.

Glossaire Lexical restreint


Lexie. Dfinition page 55. Polysmie absolue. Dfinition page 38-41. Polysmie contextuelle. Dfinition page 40. Structure contextuelle. Dfinition page 259. Superstructure. Dfinition page 262.

300

Bibliographie Articles et Ouvrages


ALBERTAZZI L. ed., 2000. Meaning and cognition. John Benjamins Company. BALTAZARD D., TRIGANO P., 1993. Des homographes aux rfrences pronominales. Thme : III (Langage Naturel). BARON I., 2000. La lexicalisation des noms composs dverbaux. Traits gnraux de la composition nominale . In Argomenti per una Linguistica della Traduzione, a cura di Iorn Korzen e Carla Marello. Edizioni dellOrso, pp. 43-52 BASSAC C., BOUILLON P., 2002. middle transitive alternation in English: a generative lexicon approach , in Many Morphologies, Paul Boucher ed. Cascadilla press, pp. 29-48. BATEMAN J.A., 1992. Towards Meaning-Based Machine Translation: using abstractions from text generation for preserving meaning. Kittredge. BLANCO X., 2001. Dictionnaires lectroniques et traduction automatique espagnolfranais . Langages n143, septembre 2001, Lexicologie contrastive espagnolfranais , pp.1-21. BLUMENTHAL P., 2006. De la logique des mots lanalyse de la synonymie , in Langue Franaise n150, juin 2006., pp.14-31. BLUMENTHAL P., BERNARD P., 2005. Quels corpus pour un dictionnaire des collocations ? , in La linguistique de corpus, G. Williams d. Linguistiques, Presses Universitaires de Rennes, pp.233-243. BORILLO A., 2001. Il y a prpositions et prpositions , in la prposition , Travaux de Linguistique n42-43, Revue Internationale de Linguistique Franaise. Duculot, pp.141-155. BOUILLON P., 1998. Polymorphie et smantique lexicale : le cas des adjectifs. Thse de troisime cycle, Lille. Presses Universitaires du Septentrion. BOUILLON P., CLAS A., 1993. La traductique. Les presses de luniversit de Montral, AUPELF UREF.
301

BREAL M., 1897. Essai de smantique (science des significations). Librairie Hachette et Cie : Paris. BRONCKART J-P., 2000. Possibles de lactivit langagire et impossibles de la langue, in Incidences de lImpossible dans le Langage, revue Smiotiques, Dcembre 2000, n18/19. CNRS-ILF, pp.153-172. CADIOT P., 1999. Espaces et prpositions , in Revue de Smantique et Pragmatique. 1999. Numro 6. Presses Universitaires dOrlans, pp. 43-70. CADIOT P., HABERT B., 1997. Aux sources de la polysmie nominale , in Langue franaise, n113, pp. 3-11. CERVONI J., 1991. La prposition. tude smantique et pragmatique. Champs linguistiques, Duculot. CHAROLLES M., LAMIROY B., 2002. zzayer, dire, parler. Les verbes de parole ou quest-ce quun verbe (in)transitif , travaux prliminaires au projet ILF Transitivit . Paris. CHOMSKY N., 1957. Syntactic structures. Mouton. CORBIN D., CORBIN P., TUTIN A., ALIQUOT S., 1996. Ce que les linguistes peuvent attendre dun dictionnaire informatis , in Lexicographie et informatique. Autour de linformatisation du Trsor de la Langue Franaise. Actes du Colloque International de Nancy (29,30 et 31 mai 1995), publis par David PIOTROWSKI. Didier rudition, Paris, pp.51-77. CORTIER C., 2001. Les syntagmes prpositionnels prdicatifs dans les grammaires universitaires : un observatoire de la place accorde aux prpositions , in la prposition , Travaux de Linguistique n42-43, Revue Internationale de Linguistique Franaise. Duculot, pp.121-140. COSRIU E., 1980. Aspect verbal ou aspects verbaux ? Quelques questions de thorie et de mthode , in : La notion d'aspect, actes du colloque organis par le Centre d'analyse syntaxique de l'universit de Metz, sous la dir. de David J., Martin R., Paris : Klincksieck, pp. 13-25. COULON D., KAYSER D., 1982. Les sens uniques conduisent des impasses . 1er Colloque de l'A.R.C., Pont--Mousson, Actes pp.1-32. CROFT W., CRUSE D.A., 2004. Cognitive linguistics. Cambridge University Press.
302

CRUSE D.A., 1986. Lexical Semantics. Cambridge textbooks in linguistics . Cambridge University Press. DANCETTE J., 1995. Parcours de traduction. tude exprimentale du processus de comprhension. tude de la traduction . Presses Universitaires de Lille. DANLOS L., 1999. Sur la corfrence vnementielle . Actes des VImes journes scientifiques du Rseau LTT, Beyrouth, Novembre 1999. DE VOGE S., PAILLARD D., 1997. Identit lexicale et htrognit de la variation co-textuelle : le cas de suivre , in Co-texte et calcul du sens, Claude Guimier d., Presses Universitaires de Caen, pp.41-61 DENIS P., MULLER P., 2004. A semantics for temporally dependent referring expressions, in O. Bonami and P. Cabredo Hofherr, editors, Empirical Issues in Syntax and Semantics 5, Papers from Cssp 2003, pp.45-62. DESCLES J-P., 1997. Systmes dexploration contextuelle , in Co-texte et calcul du sens, Claude Guimier d., Presses Universitaires de Caen, pp.215-232. DOMINICY M., MARTIN F., 2001. A travers, au travers (de) et le point de vue , in la prposition , Travaux de Linguistique n42-43, Revue Internationale de Linguistique Franaise. Duculot, pp.211-227. DRIX G., 1993. Langage C norme ANSI, vers une approche oriente objet. 2me dition. Masson, Paris. DUBOIS J., DUBOIS C., 1971. Introduction la lexicographie : le dictionnaire. Langue et langage . Larousse. DUBOIS U., 1997. Co-texte et calcul du sens dans le cas de quelques valeurs de do et du pass compos , in Co-texte et calcul du sens, Claude Guimier d., Presses Universitaires de Caen, pp.157-163. DUGAS A., 2000. Le verbe et ses prpositions. Les ditions LOGIQUES. DUGAS A., 2001. Une analyse des constructions transitives indirectes en franais , in La Prposition , Travaux de Linguistique n42-43, Revue Internationale de Linguistique Franaise. Duculot, pp.111-120.

303

DUTOIT D., 2000. Quelques oprations Sens Texte et Texte Sens utilisant une Smantique Linguistique Universaliste a priori. Thse soutenue lUniversit de Caen, spcialit Informatique Linguistique. EINSTEIN A., 1994. Sur llectrodynamique des corps en mouvement, et 6 autres textes fondamentaux sur la Thorie de la Relativit restreinte et gnrale . Traduction de M.Solovine, J. Gabay. FANG A.C., 1997. Verb Forms and Sub-Categorizations. Literary and Linguistic Computing, Vol. 12, n4. Oxford University Press, pp.209-217. FAUCONNIER G., 1984. Espaces mentaux. Aspects de la construction du sens dans les langues naturelles. Propositions. Les ditions de Minuit. FINDLER N.V. ed., 1979. Associative networks. Representation and use of knowledge by computers. Academic Press Inc. London. FRADIN B., 1988. Dcrire un verbe , in Lexique, 6, Lexique et Paraphrase, pp.87138. FRANOIS J., 1989. Changement, causation, action. Trois catgories smantiques fondamentales du lexique verbal franais-allemand. Librairie Droz. FRANOIS J., 1997a. Le cadrage cognitif des prdications de contact dans un corpus de dclarations daccidents de la route : effets du contexte et du co-texte , in Co-texte et calcul du sens, Claude Guimier d., Presses Universitaires de Caen, pp.7388. FRANOIS J., 1999. Les caractres aspectuels et participatifs des prdications verbales et la transitivit , Bulletin de la Socit Linguistique de Paris, XCIV, fasc. 1, pp.139-184. FRANOIS J., DENHIRE G. eds, 1997. Smantique linguistique et psychologie cognitive. Aspects thoriques et exprimentaux, Presses Universitaires de Grenoble. FRANOIS J., MANGUIN J-L., 2006. Dispute thologique, discussion oiseuse et conversation tlphonique : Les collocations adjectivo-nominales au cur du dbat , in Langue Franaise n150, juin 2006., pp.50-65. Frantext. Base littraire du franais, ATILF-CNRS laboratoire, Nancy, France. FUCHS C., 1994. Paraphrase et nonciation. Paris, Ophrys.
304

FUCHS C., 1996. Les ambiguts du franais. Paris, Ophrys. FUCHS C., 1997. La synonymie en co-texte , in Co-texte et calcul du sens, Claude Guimier d., Presses Universitaires de Caen, pp.31-39. GARDES-TAMINE J., 1990. La Grammaire. 2/Syntaxe. Cursus, Armand Colin. GEVAUDAN P., 1997. La polysmie verticale : Hypothses, analyses et interprtations . PhiN. Philologie im Netz2/1997, pp.1-22. GODARD D., JAYEZ J., 1993. Le traitement lexical de la coercion , Cahiers de linguistique franaise, n 14, pp.123-150. GODARD D., JAYEZ J., 1995. Principles as lexical methods. Proceedings of the AAAI Workshop on Representation and Acquisition of Lexical Knowledge, Stanford, pp.57-68. GODARD D., JAYEZ J., 1996. Types nominaux et anaphores : le cas des objets et des vnements . Cahiers Chronos 1, Anaphores temporelles et (in-)cohrence. Textes runis par W. De Mulder, L. Tasmowski-De Ryck et C. Vetters. Rodopi, pp.4158. GOSSELIN L., 1996a. Le traitement de la polysmie contextuelle dans le calcul smantique . Intellectica, 1996/1, 22, pp.93-117. GOSSELIN L., 1996b. Smantique de la temporalit en franais. Un modle calculatoire et cognitif du temps et de l'aspect, Duculot, Louvain-la-Neuve. GOSSELIN L., 1997. Les tudes psycholinguistiques sur la comprhension des expressions ambigus : une critique linguistique , in Smantique linguistique et psychologie cognitive. Aspects thoriques et exprimentaux, Jacques Franois et Guy Denhire eds., Presses Universitaires de Grenoble, pp.75-115. GOSSELIN L., 2001. Temps et aspect en franais . Programme de l'cole thmatique CNRS / Rseau de sciences cognitives d'le-de-France. GREVISSE M., GOOSSE A., 1997. Le bon usage : grammaire franaise. Treizime dition. Duculot, Louvain-la-Neuve. GROSS G., 1996a. Les expressions figes en franais. Noms composs et autres locutions. Collection lEssentiel Franais. Ophrys.
305

GROSS G., 1996b. Rendre les dictionnaires actifs in Lexicographie et informatique. Autour de linformatisation du TLF. Actes du Colloque International de Nancy (29, 30 et 31mai 1995) publis par David PIOTROWSKI. Didier rudition, Paris, pp.195-212. GROSS M., 1975. Mthodes en syntaxe. Rgime des constructions compltives. Hermann. GROSS M., 1994. Dictionnaires lectroniques et traduction automatique , in Le traducteur et lordinateur. Langages n116, Dcembre 94. Larousse, pp.48-58. GUILLAUME G., 1964. Langage et science du langage. Paris, Nizet. GUIMIER C. d, 1997. Co-texte et calcul du sens. Presses Universitaires de Caen. GUIRAUD P., 1962. Les locutions franaises. Collection Que sais-je ? Presses Universitaires de France. HANKS P., 1990. Evidence and intuition in lexicography , in Meaning and Lexicography. LLSEE 28, J. Tomaszczyk & B. Lewandowska-Tomaszczyk eds. John Benjamins, pp.31-41. HATON S., 1999. Analyse et modlisation des sens mtaphoriques des verbes de mouvement en franais . Mmoire de matrise de sciences du langage, option TAL, Universit Nancy2. HATON S., 2000. Typologie des expressions anaphoriques et/ou corfrentielles mettant en jeu un ou plusieurs syntagmes verbaux , mmoire principal de DEA sciences du langage, Universit Nancy2. HATON S., 2003. Les Champs Smantiques Multilingues Unifis . Actes du congrs international Reprsentation du Sens, Montral. HATON S., 2004. Sens, polysmie et multilinguisme : comment gnrer des champs synonymiques partir de dictionnaires de langues . Actes du colloque JETOU2003 autour du sens, Toulouse. HATON S., 2005a. Lintgration des priphrases verbales dans les Champs Smantiques Multilingues Unifis : tude autour de la priphrase se mettre . Actes du congrs international Les Priphrases Verbales Caen. John Benjamins, pp.397406.
306

HATON S. 2005b. Transitivit, constructions prototypiques et crativit langagire : comment un corpus littraire rorganise la typologie des verbes de parole en franais . Actes du colloque JETOU2005, autour du corpus, Toulouse, pp.151-164. HATON S., GRANDJEAN M., 1998. La grammaire TESP8 : construction dun analyseur syntaxique partir de lanalyseur CAT2 . Rapport de licence, cours danalyse syntaxique automatique par Mounira LOUGHRAEB, universit de Nancy2. HATON S., MASCHERIN L., 2005. A cross-languages study about Space and Time : the french verb traverser and its equivalents in english. Actes du congrs international STLL05, Rijeka, Croatie. Zadar Publications. paratre. HAUSMANN F.J., BLUMENTHAL P., 2006. Prsentation : collocations, corpus, dictionnaires , in Langue Franaise n150, juin 2006., pp.3-13. HEINZ M., 1993. Les locutions figes dans le Petit Robert . Description critique de leur traitement et propositions de normalisation. LEXICOGRAPHICA Series Maior 49. Niemeyer. HELMREICH S., JIN W., WILKS Y., GUILLEN R., 1993. Questions de traduction automatique au Computing Research Laboratory (CRL) , in La traductique, Bouillon et Clas eds. Les presses de luniversit de Montral, AUPELF UREF, pp.334-348. HIRST G., 1987. Semantic interpretation and the resolution of ambiguity. Studies in Natural Language Processing. Cambridge UP. HLLEN W., SCHULZE R. eds, 1988. Understanding the lexicon. Meaning, sense and world knowledge in lexical semantics. Linguistische Arbeiten. Niemeyer. HUTCHINS W.J., 1986. Machine translation. Past, present, future. Ellis Horwood. JACQUES M-P., 2005. Pourquoi une linguistique de corpus ? , in La linguistique de corpus, G. Williams d. Linguistiques, Presses Universitaires de Rennes, pp.21-30. JACQUEY E., 2001. Ambiguts lexicales et Traitement Automatique des Langues : Modlisation de la polysmie logique et application aux dverbaux daction ambigus en franais. Thse soutenue prs lUniversit Nancy2 le 13 Dcembre 2001. JAMROZIK E., 1992. La syntaxe et la smantique des verbes de parole en franais. Thse soutenue lUniversit de Warszawa, Pologne.
307

JI H., PLOUX S. & WEHRLI E., 2003. Lexical Knowledge Representation with Contexonyms. In Proceedings of the 9th MT summit, pp.194-201. KAROLAK, S. 2003. Rflexion Posnaniensis N45: pp. 151-175. sur la catgorie de laspect. Lingua

KAROV Y., EDELMAN S., 1996. Learning similarity-based word sense disambiguation from sparse data. Cmp-lg/9605009, pp.42-55. KILGARRIFF A., 1997. I dont believe in Word Senses , Computers and the Humanities, vol. 31, n2. Kluwer Academic Publishers, pp.91-113 KLEIBER G., 1987. Du ct de la rfrence verbale. Les phrases habituelles. Collection sciences pour la communication. Peter Lang. KLEIBER G., 1990. La smantique du prototype. Catgories et sens lexical. Linguistique Nouvelle. PUF. KLEIBER G., 1994. Discours et strotypie : le contexte peut-il remettre daplomb une anaphore associative mal forme ? , in C. Schnedecker, M. Charolles, G. Kleiber et J. David (d.), Lanaphore associative. Aspects linguistiques, psycholinguistiques et automatiques, Paris, Klincksieck, pp.93-112. KLEIBER G., 1997. Quand le contexte va, tout va et inversement , in Co-texte et calcul du sens, Claude Guimier d., Presses Universitaires de Caen, pp.11-29. KLEIBER G., 1999. Problmes de smantique. La polysmie en questions. Sens et structures. Septentrion, presses universitaires. KOZLOWSKA, M. 1998a. Aspect, modes daction et classes aspectuelles. In J. Moeschler (d), Le temps des vnements, Paris: Kim. pp. 101-121. KOZLOWSKA, M. 1998b. Bornage, tlicit et ordre temporel. In J. Moeschler (d), Le temps des vnements, Paris: Kim. pp. 221-244. KRAIF O., 1997. Modles probabilistes pour le traitement automatique de corpus textuel : perspectives et applications , in Travaux du LILLA N2, sous la direction de Henri ZINGLE. Universit de Nice-Sophia-Antipolis, pp. 81-100. KRZESZOWSKI T.P., 1990. The axiological aspect of idealized cognitive models, in Meaning and Lexicography. LLSEE 28, J. Tomaszczyk & B. LewandowskaTomaszczyk eds. John Benjamins, pp.135-165.
308

LABEAU E., 2002. Lunit de limparfait : vues thoriques et perspectives pour les apprenants du franais, langue trangre , in Travaux de Linguistique n45, La notion dinvariant smantique , Revue Internationale de Linguistique Franaise. Duculot, pp.157-184. LACA B., 2004. Les catgories aspectuelles expression priphrastique : une interprtation des apparentes lacunes du franais , in Langue Franaise n141, le franais parmi les langues romanes . Larousse, pp.85-98. LAMARCHE J., 2002. Invariance et contingence , in Travaux de Linguistique n45, la notion dinvariant smantique , Revue Internationale de Linguistique Franaise. Duculot, pp.15-44. LARJAVAARA M., 2000. Prsence ou absence de lobjet. Helsinki: Academica Scientiarium Fennica. LARRIVEE P., 2002a. La notion dinvariant smantique , in Travaux de Linguistique n45, La notion dinvariant smantique , Revue Internationale de Linguistique Franaise. Duculot, pp.7-14. LARRIVEE P., 2002b. Invariants smantiques et constructions syntaxiques , in Travaux de Linguistique n45, La notion dinvariant smantique , Revue Internationale de Linguistique Franaise. Duculot, pp.67-82. LE GOFFIC P., 1997. Formes en ant et contexte , in Co-texte et calcul du sens, Claude Guimier d., Presses Universitaires de Caen, pp.123-133. LEEMAN D., 1999. Dans un juron, il sauta sur ses pistolets. Aspects de la polysmie de la prposition dans , in Revue de Smantique et Pragmatique. 1999. Numro 6. Presses Universitaires dOrlans, pp. 71-88 LERAT P., 1999. Loffre en smantique lexicale , in Cahiers de Lexicologie. 19992. Numro 75. Revue Internationale de Lexicologie et Lexicographie. Didier rudition, pp.5-22. LEVIN B., 1993. English Verb Classes and Alternations. A preliminary investigation. The University of Chicago Press, Chicago and London. LEWANDOWSKA-TOMASZCZYK B., 1990. Meaning, synonymy and the dictionary , in Meaning and Lexicography. LLSEE 28, J. Tomaszczyk & B. Lewandowska-Tomaszczyk eds. John Benjamins, pp.181-208.
309

LUDEWIG P., 2001. LogoTax un outil exploratoire pour ltude de collocations en corpus , in Linguistique de corpus, n2/2001, Coll. Traitement automatique des langues vol 42. Hermes, pp.623-642. LYONS J., 1970. Linguistique gnrale. Paris. Larousse. MAINGUENEAU D., 2003. Linguistique pour le texte littraire, 4e dition. Collection Lettres sup., Nathan Universit. Paris. MALMBERG B., 1983. Analyse du langage au XXe sicle. Thorie et mthodes. PUF, Paris. MALRIEU D., RASTIER F., 2001. Genres et variations morphosyntaxiques , in Linguistique de corpus, n2/2001, Coll. Traitement automatique des langues vol 42. Hermes, pp.570-579. MANGUIN J-L., FRANOIS J. et alii, 2004. Le dictionnaire lectronique des synonymes du CRISCO. Un mode demploi trois niveaux. Cahiers du CRISCO n17, juillet 2004. Universit de Caen. MARTIN E., 1993. Reconnaissance de contextes thmatiques dans un corpus textuel. lments de lexico-smantique. Collection tudes de smantique lexicale CNRSINALF. Didier rudition. MARTIN R., 1988. Temporalit et "classes de verbes" , L'information grammaticale n39, pp.3-8. MAYAFFRE D., 2006. Rle et place des corpus en linguistique : rflexions introductives . Actes du colloque Rle et place des corpus en linguistique JETOU2005. Universit de Toulouse-Le Mirail, 1-2 juillet 2005, pp.5-17. MELUK I., 1996. Paraphrase et lexique dans la thorie linguistique Sens-Texte , in Lexique et paraphrase. MELUK I., 1997. Vers une linguistique Sens-Texte . Leon inaugurale au Collge de France, Chaire Internationale. MELUK I. et alii, 1984. Dictionnaire explicatif et combinatoire du franais contemporain. Recherches Lexico-Smantiques I. Les Presses de lUniversit de Montral.
310

MELUK I., CLAS A., POLGURE A., 1995. Introduction la lexicologie explicative et combinatoire. Champs linguistiques. ditions Duculot, AUPELF UREF. MULLER C., 1996. La subordination Linguistique . Armand Colin. en franais. Collection U, srie

MULLER P., SARDA L., 1998. Reprsentation de la smantique des verbes de dplacement transitifs du franais , T.A.L., vol. 39, n2, pp.127147. MULLET V., DENHIERE G., 1997. Accs au lexique et ambiguts lexicales nominales : effet de la polarit des homographes et de la nature du contexte , in Smantique linguistique et psychologie cognitive. Aspects thoriques et exprimentaux, Jacques Franois et Guy Denhire eds., Presses Universitaires de Grenoble, pp.51-74. NOWAKOWSKI M., 1990. Metaphysics of the dictionary versus the lexicon, in Meaning and Lexicography. LLSEE 28, J. Tomaszczyk & B. LewandowskaTomaszczyk eds. John Benjamins, pp.3-19. NUNBERG G., ZAENEN A., 1992. Systematic polysemy in lexicology and lexicography. Euralex 92, Proceedings, pp.387-396. OOI V.B.Y., 1998. Computer corpus lexicography, Edinburgh Textbooks in Empirical Linguistics. OTMAN G., 1996. Les reprsentations smantiques en terminologie. Sciences cognitives, Masson. PAILLARD D., 1997. Co-texte, collocations, lexique , in Co-texte et calcul du sens, Claude Guimier d., Presses Universitaires de Caen, pp.63-71. PAILLARD D., 2002. Prpositions et rection verbale , in Travaux de Linguistique n44, La prposition (suite) , Revue Internationale de Linguistique Franaise. Duculot, pp.51-67. PEETERS B., 2002. La mtalangue smantique naturelle au service de ltude du transculturel , in Travaux de Linguistique n45, La notion dinvariant smantique , Revue Internationale de Linguistique Franaise. Duculot, pp.83-101. PEROZ P., 2002. Rgularits de la variation smantique du verbe lutter , in Travaux de Linguistique n45, La notion dinvariant smantique , Revue Internationale de Linguistique Franaise. Duculot, pp.45-66.
311

PICOCHE J., 1994. Didactique du vocabulaire franais. Nathan, Paris. PICOCHE J., ?. Les deux recettes de base de la cuisine lexicale . Revue le franais dans tous ses tats, n30 Paul Valry-enseigner la langue. Montpellier. PLOUX S., 1997. Modlisation et traitement informatique de la synonymie . Linguisticae Investigationes, Tome XXI/1997, Fascicule 1. PLOUX S., JI H., 2003. A Model for Matching Semantic Maps Between Languages ( French / English, English / French ). Computational Linguistics. 29(2), pp.155-178. PLOUX S., VICTORRI B., 1998. Construction despaces smantiques `a laide de dictionnaires informatiss des synonymes . TAL, 39(1), pp.161182. POLGUERE A., 1998. La thorie Sens-Texte , in Dialangue, Vol. 8-9, Universit du Qubec Chicoutimi, pp.9-30. POLGUERE A., 2000. Towards a theoretically-motivated general public dictionary of semantic derivations and collocations for French. Proceedings of EURALEX 2000, Approaches to Lexical Combinatorics, pp.517-529. PREVOST S., 2003. Les complments spatiaux : du topique au focus en passant par les cadres , in Travaux de Linguistique n47, adverbiaux et topiques , Revue Internationale de Linguistique Franaise. Duculot, pp.51-77. PUSTEJOVSKY J., 1996. The generative lexicon. The MIT Press. PUSTEJOVSKY J., BOUILLON P., 1996. Aspectual Coercion and Logical Polysemy in : Pustejovsky J. et al. (eds.). Lexical Semantics, Oxford, Clarondon Press, pp.133-162. QUINE, 1960. Word and Object. MIT Press. RABATEL A., 2003. Les verbes de perception en contexte deffacement nonciatif : du point de vue reprsent aux discours reprsents , in Travaux de Linguistique n46, Revue Internationale de Linguistique Franaise. Duculot, pp.49-88. RASTIER F., 2005. Enjeux pistmologiques de la linguistique de corpus , in La linguistique de corpus, G. Williams d. Linguistiques, Presses Universitaires de Rennes, pp.31-45.
312

REBOUL A., 1999. Concepts spcifiques, concepts gnriques : la rfrence et le systme conceptuel dans les reprsentations mentales . Sminaire interne, LEDLORIA, 25/11/1999. Document de prsentation, pp.17-18. RECANATI F., 1997. La polysmie contre le fixisme. Langue Franaise, n113, Mars 1997. Aux sources de la polysmie nominale. P. Cadiot, B. Habert (ed), pp.107-123. RECANATI C., RECANATI F., 1999. La classification de Vendler revue et corrige , Cahiers Chronos 4, La modalit sous tous ses aspects, textes runis par S. Vogeleer, A. Borillo, M. Vuillaume et C. Vetters, Amsterdam/Atlanta, pp.167-184 REY A., CHANTREAU S., 1997. Dictionnaire des expressions et locutions. Le Robert. RIEGEL M., PELLAT J-C., RIOUL R. 1994. Grammaire mthodique du franais. PUF Linguistique Nouvelle. ROUSSEAU A., 2000. Lirrel ou le dfi de limpossible dans la langue , in Incidences de lImpossible dans le Langage, revue Smiotiques, Dcembre 2000, n18/19. CNRS-ILF, p ;15-30. ROUSSELOT F., GAGEAN N., 2005. Les phnomnes linguistiques et extralinguistiques qui altrent lanalyse linguistique automatique de textes , in La linguistique de corpus, G. Williams d. Linguistiques, Presses Universitaires de Rennes, pp.337-356. SAINT-DIZIER P., VIEGAS E. eds, 1995. Computational Lexical Semantics. Studies in Natural Language Processing. Cambridge University Press. SANCHEZ PEREZ F.J., 1994. De la Dsambigusation Assiste par Ordinateur llaboration des Grammaires Textuelles . Literary and Linguistic Computing, vol. 9, N3, 1994. Oxford University Press, pp.195-202. SCHNEDECKER C., CHAROLLES M., KLEIBER G. et DAVID J. (ed.), 1994. Lanaphore associative. Aspects linguistiques, psycholinguistiques et automatiques, Paris, Klincksieck. SIBLOT P. ed., 1990. Le langage et le rel, Cahiers de Praxmatique15. SMALL S.I., COTTRELL G.W., TANENHAUS M.K. eds., 1988. Lexical Ambiguity Resolution. Perspectives from psycholinguistics, neuropsychology & artificial intelligence ; Morgan Kaufmann Publishers.
313

SNELL-HORNBY M., 1990. Dynamics in meaning as a problem for bilingual lexicography, in Meaning and Lexicography. LLSEE 28, J. Tomaszczyk & B. Lewandowska-Tomaszczyk eds. John Benjamins, p;209-226. SOWA J., 1983. Generating language from conceptual graphs, comp. & Maths with Appls, volume 9, numro1, pp.29-43. SOWA J., 1992. Logical structures in the Lexicon in Lexical Semantics and Commonsense Reasoning, edited by James Pustejovsky and Sabine Bergler, LNAI 627, Springer-Verlag, Berlin, 1992, pp.39-60. TODOROV T., 1967. Littrature et signification. Paris: Librairie Larousse. TOMASZCZYK J., LEWANDOWSKA-TOMASZCZYK B. eds, 1990. Meaning and Lexicography. LLSEE 28. John Benjamins. TOURATIER C., 1996. Le systme verbal franais. Collection U, srie Linguistique . Armand Colin. TOURY G., 1990. Translation-specific lexical items and their representation in the dictionary, in Meaning and Lexicography. LLSEE 28, J. Tomaszczyk & B. Lewandowska-Tomaszczyk eds. John Benjamins, pp.287-300. VALETTE M., 2004. Smantique interprtative applique la dtection automatique de documents racistes et xnophobes sur Internet , in Approches Smantiques du Document Numrique, Actes du 7e Colloque International sur le Document lectronique, 22-25 juin 2004, Patrice Enjalbert et Mauro Gaio, d., 2004, pp.215-230. VANDELOISE C., 1999. Quand dans quitte lespace pour le temps , in Revue de Smantique et Pragmatique. 1999. Numro 6. Presses Universitaires dOrlans, pp.145-162. VENDLER Z., 1967. Linguistics in Philosophy, Ithaka, New York: Cornell University Press. VERSTIGGEL J-C., 1997. Le rle du contexte dans la construction de la signification , in Smantique linguistique et psychologie cognitive. Aspects thoriques et exprimentaux, Jacques Franois et Guy Denhire eds., Presses Universitaires de Grenoble.

314

VET C., 1980. Temps, aspects et adverbes de temps en franais contemporain, Genve. Droz. VICTORRI B., 1997a. La place du mouvement dans la structure smantique des langues , communication prsente l'cole d't de l'ARC/CNRS : Le mouvement des boucles sensori-motrices aux reprsentations cognitives et langagires . (article obtenu ladresse : www.utc.fr/arco/activites/ecoles/Bonas77/Victorri.html) VICTORRI B., 1997b. Modliser les interactions entre une expression polysmique et son co-texte , in Co-texte et calcul du sens, Claude Guimier d., Presses Universitaires de Caen, pp.233-245. VICTORRI B., ?. Comment modliser la construction dynamique du sens dun nonc ? . Sminaire Intelligence Artificielle du LIP6. VICTORRI B., FUCHS C., 1996. La polysmie, construction dynamique du sens. Hermes. VIOLI P., 2000. Prototypicality, typicality and context. In Meaning and Cognition, Liliana Albertazzi ed. CELCR, John Benjamins Publishing Company, pp.103-122. WALTER H., 1994. Laventure des langues en Occident. Leur origine, leur histoire, leur gographie. Robert Laffont. WIERZBYCKA A., 1996. Semantics. Primes and universals. Oxford University Press. WILLIAMS G. & alii, 2005. La linguistique de corpus. Linguistiques, Presses Universitaires de Rennes. YOUNG S., BLOOTHOOFT G. eds, 1997. Corpus-based methods in language and speech processing, ELSNET, Kluwer Academic Publishers.

Dictionnaires Dictionnaire bilingue franais-anglais Robert & Collins. Dictionnaire bilingue franais-espagnol Robert & Collins, les pratiques . Dictionnaire bilingue franais-italien Robert & Collins, les pratiques . Dictionnaire bilingue franais-espagnol Larousse. Dictionnaire bilingue franais-italien Bordas.
315

TLF et TLFI, CNRS-Inalf, Nancy. Petit Robert franais. Petit Larousse franais. Websters Universal Dictionary English. Dictionnaire des synonymes de lINALF. Nouveau dictionnaire des synonymes Larousse. Routledge Dictionary of Language and Linguistics, by H. BUSSMANN, translated and edited by G.P. Trauth & K. Kazzazi. Routledge, 1996.

Quelques Pages Internet Sur les classes dobjets : http://www-lli.univ-paris13.fr/rapport/LG/ClassesObjets.htm http://www-lli.univ-paris13.fr/rapport/LG/humains.htm

316

S-ar putea să vă placă și