Sunteți pe pagina 1din 11

/ /

Quelle place pour les sciences des textes dans l'Analyse de Discours ?

Semen
Rev ue de smio-linguistique des tex tes et discours

21 | 2006 : Catgories pour l'analyse du discours politique

Quelle place pour les sciences des textes dans l'Analyse de Discours ?
JEAN-MARIE VIPREY

Entres dindex
Mots-cls : Corpus, Acquisition de donnes, Philologie num rique, Analy se textuelle de discours, Archiv e

Texte intgral

Introduction : texte et discours, encore et toujours


1

Contribuer, ne serait-ce qu ltat desquisses, comme le requiert largument de cette liv raison de Semen, donner des directions de travail claires pour lanaly se de discours, soulv e une srie de problmes dont lex plicitation pourrait paratre dj une srieuse contribution. Tout parcours bibliographique, mme rduit, dans ce champ dont pourtant on a prononc plusieurs fois lpuisement, est un v ertigineux (et parfois accablant) dfi au dsir de sy nthse. Jacques Guilhaumou, dans son approche critique compare (Guilhaumou 2005) des deux tentativ es incarnes par deux dictionnaires (Dtrie, Siblot & V rine 2001 , Charaudeau &Maigneneau et 2002) permet de le comprendre et de laccepter en des termes aux quels je souscris massiv ement. Il nous conv ainc notamment de ce que toute sy nthse en la matire ne peut v iter de soulev er la question de sa propre inscription historique (rfrence ou non, et quelle, un acte fondateur pour reprendre les termes de lauteur). Plutt que de relev er ce dfi de manire indiffrencie, je me propose de situer briv ement mon propos dans lnonc dun parcours singulier, que je ne v eux ni surv aluer, ni tenir pour anodin. Il me semble en effet que la rgle implicite que simposent (ici et ailleurs) les collaborateurs de ce numro, rgle que tous rapportent dailleurs une pistmologie et une dontologie (quelles quen soient les nuances), de parler dune plnire premire personne du singulier, est un cap ncessaire sinon suffisant. Du fait quelle na jamais t une discipline acadmique, personne nest jamais v enu sans dtour lanaly se de discours, ni surtout dans une claire intention dy parv enir. Je crois mme que ce mode daccs indirect en dit plus long sur le statut du champ que bien des spculations. Lanaly se de discours se dfinit dabord en ce quelle semble apte combler un manque dans telle ou telle discipline constitue, aux objets dlimits de manire passablement claire et stable. Ce manque est poly morphe, mais on peut commencer le cerner comme un besoin de plus dempiricit, au sens o Pierre Fiala lentend ici mme, au sens aussi o Georges-Elia Sarfati (2003 : 432) note que lAD manque le tex te en tant que tel1 du fait dune disparit thorique initiale []. De ce point de v ue, dans mon parcours acadmique, elle na pas peu ressembl cet autre w aste land quest la sty listique. Cette dernire, pour le littraire que jtais, fut le bureau de change indispensable au linguiste que jaspirais dev enir. Or, pas plus que la sty listique nest la science du style , lanaly se de discours nest lanaly se/du/ discours et, lorsque je cherche dfinir le second

http://semen.revues.org/1995

1/11

/ /

Quelle place pour les sciences des textes dans l'Analyse de Discours ?
(discours ), il me rev ient immanquablement la formule lumineuse, propos du premier (style ), de Robert Martin au Colloque de 1 994 (in Molini & Cahn, 1 994 : 1 3) : Ce sont des concepts que les pistmologues disent rgulateurs . Ils ont un contenu vague, tout au plus suffisant pour permettre transitoirement de dlimiter un domaine. Jai toujours entendu, sous rgulateurs , plus encore que ny autorise ex plicitement R. Martin, sav oir aussi quelque chose de lordre du transactionnel, autrement dit du transdisciplinaire ; ce qui confre cette classe de concepts un caractre indispensable au jeu des disciplines humanistes entre elles, mme si certains ont dailleurs une ou plusieurs acceptions dures dans ces mmes disciplines. Paradox alement, institu sty listicien par ma thse et ma double qualification CNU, jai t amen inaugurer mes pratiques du tex te dans le rejet ou plutt dans lignorance de tout ce qui ntait pas lui . Cest ainsi que jai t longtemps rtif au concept de discours littraire , qui me semblait rintroduire en contrebande tout ce que la perspectiv e structurale av ait v ou aux tnbres ex trieures ( sa v ie/son uv re , le socio-biographique, lhistoire des formes et des ides). Dans le dialogue entretenu av ec Jean-Michel Adam depuis dix ans, la discussion des rapports rciproques des notions de discours et de texte a pu paratre spcieuse (V iprey 1 997 : 24ssqq), mais elle aboutit selon moi aujourdhui (V iprey 2006) lauthentique dpassement dialectique dune contradiction bloque, dpassement qui permet au spcialiste du tex te de rinv estir une sphre du discours dsormais dplace. Ainsi, puisque lobjet de cette contribution est prcisment l et afin de pouv oir le dv elopper ici, la question de la place des sciences du texte dans lanalyse de discours peut tout simplement tre pose, alors que jusqu prsent elle nav ait de sens ni pour ceux qui considraient texte et discours comme deux termes alternatifs (donc quiv alents) pour dsigner lnonc, ex primant juste deux points de v ue diffrents mais conv ergents, ni pour ceux qui tendaient liminer lun des deux termes (texte ) de leur optique, creusant ainsi le dficit philologique (Rastier, 2001 ), le manque empirique constat dans lv olution de lanaly se de discours franaise . Le changement de paradigme, dAnalyse des textes et des discours v ers Analyse textuelle des discours est donc emblmatique.

1. Discours et analyse de discours


7

10

Parv enus ce point, nous ne pouv ons pas trav ailler sur des dfinitions du discours qui prtendent lindpendance de la notion v is--v is du sy ntagme analyse de discours . Il peut mme tre trs profitable de poser que le discours est lobjet de lanalyse de discours , reportant tout le poids de la rflex ion sur cette dernire. LAD est une prax is, partir du moment inaugural o les auteurs de Langages 1 3 arrachent le sy ntagme (le drapeau) anglo-amricain de Zellig Harris de son contex te et lemportent sur leur propre barricade, en altrant profondment et dfinitiv ement le sens (sans que jamais on puisse, ultrieurement, nier lex istence dun inv ariant). Quelle est cette prax is ? Dautres, notamment Guilhaumou, sont qualifis pour en rendre compte. Mais de lex trieur, et rtrospectiv ement, on est presque forc v oir que lAD a fonctionn et fonctionne encore av ant tout comme un positionnement de spcialistes dans et aux marges de leur discipline (lhistorien linguiste de Guilhaumou), positionnement destin redistribuer les fondements et surtout les frontires de cette discipline en lintressant une certaine classe dobjets (les vnements discursifs ou langagiers par ex emple) quelle fait saillir dans le champ dinv estigation. Pour les linguistes de leur ct, lintrt de lAD aura plutt t, et bien des gards demeure, dempcher la driv e des sciences du langage v ers le champ des disciplines naturalistes, en allant prouv er av ec les historiens, les sociologues, les littraires, lhistoricit (diachronique, mais aussi et peut-tre surtout sy nchronique) de leurs propres objectiv ations. Prax is, elle lest aussi de par lorientation pistmologique quelle rev endique pardel la div ersit de ses courants constitutifs : prsence dy namique du chercheur son objet, qui nest jamais conu comme un donn , mais au contraire comme produit dune construction et dun engagement, et sujet dune commande historique. Que cette commande v ise le dv oilement des idologies, la matrise socitale de largumentation, la connaissance des routines perv erses dans linterdiscours, lv aluation esthtique de lart v erbal, elle a sy stmatiquement v oir av ec une rationalit pratique. En aucun cas donc, lAD ne saurait tre rcapitule, ni surtout re-programme, comme une discipline qui soccuperait du discours aux lisires de la linguistique. Lhistorien linguiste , le sociologue du ct du discours restent un historien et un sociologue, le linguiste centr sur les oprations et concepts de lAD reste un linguiste, chacun occup inflchir sa propre discipline dans le sens indiqu cidessus. Dans ces conditions, quelle place pour les sciences du tex te ? Elle est ncessairement duelle, puisquelle concerne celles-ci comme champ thorique dune

http://semen.revues.org/1995

2/11

/ /

Quelle place pour les sciences des textes dans l'Analyse de Discours ?
part, comme univ ers producteur et/ou rgulateur de techniques de lautre. Parmi les multiples v oies par lesquelles lAD ouv re lespace du tex te, il nen est pas de plus clairante que celle de la dialectique de larchive , des bases et des corpus . Si larchiv e doit tre lune des deux matrialits du discours (av ec dautre part la langue), bien quelle ne soit pas lensemble des textes quune socit a laisss , elle se dfinit bien comme un ensemble de dispositifs tex tuels destins une mise en ordre et soumis un questionnement dautorit . Surtout, lun des grands ax es de la prax is AD consiste prcisment dans le programme de lire larchive , sur lequel nous rev iendrons bientt. Mais larchiv e ainsi entendue soppose aussi, et plus radicalement, aux archiv es telles que les institutions les entretiennent et telles que lre numrique les sy stmatise. Larchiv e est un concept opratoire v oquant la matrialit discursiv e, les archiv es, qui sont aujourdhui nommer bases , sont des recueils de tex tes et leur ensemble forme bien, potentiellement, celui de lensemble des textes quune socit gnre (y compris dans les processus denqutes et dinterv iewes, par leur enregistre ment). Cest dans ces bases de tex tes que nous allons dcouper et regrouper des corpus , et conv ersement cest aussi dans la construction des corpus que nous faisons saillir et changer les proprits des bases, cest--dire fondamentalement, la configuration des tex tes. En effet, la lecture darchiv e au sens plein nest pas une consommation de son contenu , car un intrt singulier y prside dans le processus dun constant remaniement. Une tude sincre dans larchiv e, mene donc selon lun des angles dattaque que fdre le nom de lAD, comporte toujours un aspect de contribution larchiv e en termes dapport dattestations, denrichissement et dannotation tmoignant du passage de la recherche, tout cela consign dans la base. Cest ce quon peut esprer formaliser plus sy stmatiquement qu lge de limprim, dans lre numrique.

11

2. Lvolution des sciences du texte aux prises lanalyse de discours


12

13

14

15

En dautres termes, les disciplines centres sur les tex tes subissent aujourdhui, programmatiquement deux grandes classes dinflex ions : certaines sont ncessites par le dialogue interdisciplinaire tel quil se cristallise dans lv olution mme de lAD, et notamment dans le recentrage, qui me semble clair, de celle-ci sur les noncs attests et tablis ; dautres, plus amples encore sans doute (mais non coupes des prcdentes), sont en relation av ec lclatement du support imprim, lex plosion des ressources et des rseaux de ressources, les nouv elles pratiques de lecture et dcriture induites. Sil faut donc clairer des directions de trav ail, ce sera dabord quant lpistmologie et au remaniement des sciences du tex te . Je mentionnerai donc trois ax es de coopration, qui sont autant de fronts ouv erts dans lagenda du ple Archive, Bases, Corpus que je coordonne la jeune Maison des Sciences de lHomme de Franche-Comt et que nous aurions tous intrt v oir conv erger quelque peu. Av ant tout, lAD rev italise en permanence les div erses v ersions de la linguistique textuelle . On peut renv oy er ici dune part lav ancement critique considrable des trav aux autour de lquipe de Jean-Michel Adam Lausanne, av ec deux mises jour complmentaires, lune indiv iduelle o il met dfinitiv ement en circulation2 la notion danalyse textuelle des discours (Adam 2005), lautre collectiv e, o nous av ons particip (Adam & Heidmann 2006) et qui a dj t v oqu en introduction. Dautre part, langle dattaque particulier, aujourdhui en plein renouv eau, que reprsente le rseau du CRISCO de Caen, av ec notamment le numro de Langages , Unit(s) du tex te , coordonn par Dominique Legallois3 . Les dimensions tex tuelles autres que squentielles se pensent dans de nouv elles conditions lorsque lnonc chappe lex clusiv it linaire ou tabulaire du support papier, entre dans la gomtrie de v astes rseaux et de grandes sries. Ensuite, lAD ne peut laisser indiffrent et intact le chantier des linguistiques de corpus . Dans ce domaine, on peut certes dabord dissocier une linguistique par les corpus, quex emplifie notamment Douglas Biber, dv eloppement ce jour ultime du courant empiriciste inaugur par Bloomfield ( distinguer rigoureusement du recours opportuniste, et souv ent a-thorique, des corpus slectifs par des reprsentants de linguistiques par ailleurs dessence introspectiv e), et des outils linguistiques, parmi dautres non-linguistiques, pour les corpus, que prsentent par ex emple (Habert, Nazarenko, Salem 2001 ). Mais ce sera pour sapercev oir bien v ite de la dialectique serre et fconde qui est luv re ici, comme le montre trs bien louv rage collectif dit par Geoffrey Williams (2005) et la srie de colloques laquelle il renv oie. Il en v a de mme lorsque la smantique se confronte aux corpus (Condamines 2002). Ce qui frappe en particulier, cest la tendance de ces approches fondamentales trav ailler sur des noncs de plus en plus complex es, de plus en

http://semen.revues.org/1995

3/11

/ /

Quelle place pour les sciences des textes dans l'Analyse de Discours ?
plus embray s, de plus en plus cohsifs : de plus en plus tex tualiss.

Ads not by this site 16

17

18

Enfin, lAD marque depuis longtemps un rapport singulier av ec le domaine des statistiques tex tuelles, que nous ne prendrons pas dabord sous langle technique ou fonctionnel, mais rellement conceptuel. De Guiraud Muller, de Zipf Benzcri4, les fondateurs de ce champ ont dabord mis en v idence le caractre profondment statistique de certains niv eaux fondamentaux de la configuration tex tuelle et intertex tuelle. Certains poticiens peuv ent bien nier furieusement toute pertinence ces propositions ; ils seraient tout le moins bien av iss de ne pas en ce cas se risquer parler du lex ique et/ou du v ocabulaire, de la sy ntax e, de la prosodie, et de donner leurs rythmes lacception la plus prudemment v asiv e ou mtaphy sique qui puisse tre. Sans doute dailleurs ne mettons-nous pas non plus la mme chose sous le terme de texte . Une fois affirm ce cadre pluriel de contribution la refonte des sciences du tex te, une fois dcide la construction du rseau dquipes quil implique, ce trav ail complex e ne peut se concev oir sans av ances simultanes dans les enjeux technologiques. Les communauts de lAnalyse de discours comprennent bien aujourdhui que nous av ons besoin de tex tes plus nombreux , plus reprsentatifs et plus solidement tablis. Mais si le numrique est bien le v ecteur, le sige et lenjeu dune rv olution technique, il serait aussi absurde quil la toujours t, et combien plus dangereux que jamais, de croire que cette rv olution technique irait engendrer spontanment une mise jour thorique, ainsi que de sillusionner sur la qualit des rponses techniques primitiv es, surgies du march des nouv elles technologies , lorsquil sagira dacqurir et de qualifier nos ressources.

3. Les problmes de lacquisition des ressources


19 20

21

22

Prenons un ex emple, emprunt une ex prience modeste et localise. Av ec Philippe Schepens, nous av ons entrepris dex plorer les contours dun v nement discursif, puis langagier, dont nous formons lhy pothse : les lections franaises de 2002 (prsidentielle surtout, lgislativ e un moindre degr, et pour cause) ont t profondment influences par une mergence ex ceptionnelle du discours de linscurit , mergence si forte, et ay ant aussitt suscit un tel mtadiscours, quelle a sans doute franchi le seuil au-del duquel la langue ellemme se stabilise dans un nouv el tat sur ce massif thmatique. En dautres termes, la gesticulation v erbale scuritaire des grands mdias et des appareils politiques de lordre tabli a dabord contribu un rsultat dans lordre institutionnel (prsence traumatique de Le Pen au 2 n d tour, rlection pseudo-consensuelle dun prsident sortant trs largement dconsidr, triomphe des options ultra-librales, v iction de lespace public de plus dun tiers de llectorat, prcisment le plus disponible aux inv estissements sociaux et civ iques, etc.). Puis ce rsultat, en retour, a produit un affaissement des dispositifs langagiers de rsistance aux options scuritaires, trav estissant encore un peu plus les signifiants du thme trav aill et ouv rant la v oie la stabilisation de formules et de grands fragments de discours prcontraints au serv ice de la prennisation, du durcissement du rgime en place et des paresseuses routines des grands mdias. Si cette hy pothse peut tre ex plore, cest ty piquement dans la lecture de larchiv e, o elle ne pourra manquer de former des reliefs particuliers. Nous av ons donc entrepris de collecter des lments archiv istiques, et pour commencer par un bout, la presse nationale quotidienne des quatre mois qui prcdent le 1 er tour de la prsidentielle. Nous nous sommes adresss, pour cela, une base , en loccurrence entretenue par LexisNexis, o nous av ons recueilli lensemble des tex tes concerns, soit env iron 250 millions doctets. Nous en av ons tir deux corpus, selon deux orientations complmentaires : Philippe Schepens, lensemble des articles comportant au moins une occurrence du v ocable inscurit ; moi-mme, lensemble intgral, qui est concern par la suite de mon propos. LexisNexis est une division du groupe anglo-nerlandais Reed Elsevier ( ce titre, accessible par des abonnements de bibliothques univ ersitaires), et se prsente comme l'un des premiers acteurs mondiaux de l'actualit et de l'information juridique, conomique et financire . Cest aussi le nom dune v aste interface de recherche v ers 36 000 sources d'actualit et d'information conomiques et financires . Le site anglais fait rfrence au support to non-profit organizations that

http://semen.revues.org/1995

4/11

/ /

Quelle place pour les sciences des textes dans l'Analyse de Discours ?
help make the community a better place to live and work 5 . O lon v oit que cette entreprise ne relv e pas du mercantilisme le plus sauv age ni le plus affirm. Lintrt proprement heuristique de cette filire dacquisition des ressources aura t, pour des chercheurs moy ennement nafs, triple : dabord, elle a lav antage (1 ) dtre dj finance par les abonnements, trs coteux , que souscriv ent les SCD univ ersitaires, tandis que laccs direct aux archiv es de ces journaux est hors de prix pour les institutions de recherche ; ensuite, ces facturations par les groupes de presse ne laissent pas apparatre de leur part, pour linstant, la moindre considration particulire pour les recherches entreprises dans les secteurs univ ersitaires, quelques ex ceptions prs6.

23

Ads not by this site 24

25

26

Mais dun autre ct, les bases qui se trouv ent en arrire-plan de linterface Lex isNex is nous sont en bonne partie opaques7 , et en tout tat de cause (2) le besoin apparat immdiatement de transfrer les donnes ex traites dans des bases que nous pouv ons administrer et entretenir nous-mmes, sur des critres de recherche ex perte. Or cette dmarche peut peine tre formule, puisque sa gnralisation contredirait les rgles mmes demploi de ces abonnements. Donc, (3) le recours aux bases dditeurs priv s, rendues accessibles grce aux abonnements souscrits par les SCD ou par le CNRS, met cruellement en relief la carence dune politique publique face aux nouv eaux dfis de larchiv age. Il sagit l dun des problmes majeurs des sciences humaines, et donc de lAD, dans les prochaines dcennies. Les ressources numrises seront-elles la proprit dentreprises lucrativ es, mme ex primant de gnreuses intentions, ou au contraire le bien public, ce qui ex ige, de la part des organismes qui administrent le dpt lgal et les Archiv es, un effort sans commune mesure av ec ce qui est aujourdhui consenti8 ? Contrairement ce que pourrait se reprsenter un lecteur press, ces considrations ne sont pas trangres ou accessoires notre propos. Elles me semblent au contraire trs leur place dans un dossier sur lAnaly se de Discours, surtout compte tenu de lclairage qui est celui de ce v olume. En effet, des formules comme celle de Rastier (in Williams 2005 : 33) : larchiv e contient lensemble des documents accessibles sont trs discutables ; tous gards, larchiv e est un enjeu, v oire un combat, pour effleurer une rhtorique peut-tre passe de mode, et non une ressource disponible, comme je v iens de tenter de le montrer. En tout cas, les structures de recherche doiv ent aujourdhui, du mme pas quelles rclameront le droit lgal de crer et de mettre en ligne de telles ressources, les constituer et se donner les moy ens de les enrichir. Pour cela, nous av ons besoin de nous mettre mieux en rseau, de manire v iter de doublonner les tches souv ent fastidieuses lies lacquisition initiale, et nous assurer que, si nous av ons parfois des v ersions v ariantes des mmes tex tes, ce nest pas par accident de saisie, mais au contraire parce quil sagit authentiquement dune srie dans la configuration du mme tex te et, en ce cas, que nous pouv ons en rendre compte et le traiter (on pense dabord au tex te littraire, mais lex prience de Jean-Michel Adam montre bien que sur le discours politique on rencontre le mme ty pe de v ariation, et lenseignement de Jean Pey tard (Pey tard 1 993) nous rappelle que ces v ariations sont des lieux infiniment prcieux pour lanaly se du discours).

4. Les problmes de ltablissement


27

Lun de nos problmes majeurs est quen gnral, lacquisition initiale se fait dans lurgence de la constitution dun corpus. Il nex iste gure aujourdhui de politique dacquisition planifie, sy stmatique et collectiv e. Cest pourtant lorientation que suggrent les initiativ es Textopol et Politext 9, qui mriteraient dtre fdres et largies un plus v aste ensemble de domaines du discours. Ds leur acquisition, mme si celle-ci est contrainte par une recherche dtermine, les tex tes dev raient pouv oir tre capitaliss dans une base communautaire (plutt que commune au sens strict) ds lentre de laquelle ils subiraient un certain nombre de traitements destins amorcer leur tablissement scientifique 10.

Ads not by this site 28

Ces traitements doiv ent tre non-destructifs, cest--dire prserv er lintgralit des proprits pertinentes (juges telles dans un consensus communautaire pluriel et non hgmonique) de la source : par ex emple, disposition dans laire scripto-

http://semen.revues.org/1995

5/11

/ /

Quelle place pour les sciences des textes dans l'Analyse de Discours ?
v isuelle du journal, ty pographie, coquilles etc. Traditionnellement, on pose que cela se juge par la possibilit ou non de reconstituer la surface graphique partir de la ressource numrise, et dy effectuer des recherches sur les critres des dites proprits pertinentes. Cette louable formulation nest plus aujourdhui assez prcise, car ce quon entend traditionnellement par l, cest essentiellement le tex te brut , par opposition notamment au tex te lemmatis. Or le texte brut nest la surface graphique que par approx imation, et il a t parfois indment sacralis au dtriment de celle-ci. Lobjectif le plus ambitieux , mais qui est programmatiquement ncessaire, est de pouv oir donner accs au PDF. La non-destructiv it se formule donc ainsi : partir de toute tape du traitement des ressources, on doit pouv oir remonter sans perte lune des tapes antrieures11 . Ces traitements doiv ent tre coopratifs. Cest trs certainement laspect la fois le plus difficile et le plus stimulant pour la communaut des sciences tex tuelles, car il nous fait env isager une nouv elle re du scribe-copiste-philologue, le scriptorium numrique en quelque sorte, av ec tout ce quune telle projection v hicule la fois de pratique et dutopique. Prenons ici lex emple de la lemmatisation et la polmique qui oppose ses partisans et ses adv ersaires. Dun ct, il semble et il est en effet - absurde quau prtex te de distinguer les singuliers et les pluriels des substantifs (v oir libert droit , etc.), on puisse sinterdire de distinguer ladjectif DROIT des substantifs DROIT et DROITE, didentifier sans dtour inutile des locutions comme DE DROIT , EN DROIT , DROIT COMMU N , v oire de distinguer au moins deux acceptions de DROITE, etc. De lautre, il est non moins v ident que toute lemmatisation (et plus largement toute annotation lie une identification12 linguistique) est une opration interprtativ e, qui risque de se rv ler intrusiv e si elle nest pas matrise comme telle. Il ne sert rien et il est mme dangereux , pour prv enir ce risque, dinv oquer lamlioration et/ou la normalisation des connaissances et procdures linguistiques. Il faut au contraire concev oir, ds maintenant, des mthodes gnrales permettant dassocier une gamme trs div erse dannotations signes aux fichiers de texte brut (donc, par remonte, aux fichiers PDF), offrant la possibilit (donc la libert) lex ploration de recourir ou non ces annotations comme critres ou comme ressources. Il est peu prs certain que seule lannotation dporte , reposant sur le recours gnralis aux mark-up languages rpondra terme cette ncessit. En change, il est essentiel duv rer des consensus communautaires. Par ex emple, je propose qui v oudrait y cooprer, de nous doter dun env ironnement dtiquetage lex ical, morpho-flex ionnel et potentiellement sy ntax ique autonome par rapport aux logiciels de TALN et/ou aux logiciels lucratifs, qui ne prsentent pas les caractristiques les plus utiles nos besoins ; malgr leur indniable div ersit et leur efficience propre, ils ont en commun de ntre pas conus pour ltiquetage contrl, ex haustif, fin et durable auquel nous pouv ons aspirer ; ce dernier ne saurait tre assur que (1 ) par lalternance de phases automatiques et de phases ouv ertes, interactiv es, conv iv iales (2) par laccs plnier aux ressources descriptiv es (dictionnaires, listes et automates contex tuels). Cest le sens du dv eloppement du logiciel DiaTag sous ma responsabilit Besanon : une proposition, qui ne se donne pas pour objectif de jeter un logiciel de plus sur le march, mais dillustrer et de contribuer la fabrication dun outil commun, ouv ert, finalis. A ce jour, DiaTag permet demmagasiner dans un conteneur unique, et de rendre accessibles lex ploration assiste, toute linformation enregistre dans des dictionnaires, filtre au besoin et si possible par des automates contex tuels, et contrle manuellement chaque fois que ncessaire (dans un cadre aussi ergonomique que possible). On peut certes et combien lamliorer (ressources, implmentation, apprentissages, affinage diachronique, etc.) et terme laffranchir de son rattachement institutionnel actuel et de son auteur primitif, mais sa spcificit, me semble-t-il unique, est de permettre et dex iger la prsence (donc, la signature) dun oprateur humain qui, par principe, dev ra se dfinir comme oprateur du corpus . Cela ne se fera jamais Singapour ni dans des pools de dacty los, et cela ne sautomatisera jamais. Cela ne se normalisera jamais non plus : les choix darrire-plan ou de premier plan, qui prsideront cet tiquetage, sassumeront comme eux -mmes historiques . Ne pouv ons-nous pas nanmoins esprer, si cela est fait collectiv ement, inscrire notre propre trav ail dans larchive ? Pour en finir av ec cette approche, ncessairement partielle, de la problmatique dtablissement, il faut v oquer la question, dj effleure supra , de la v ariation, qui ne concerne pas ex clusiv ement la sphre littraire loin sen faut. Dans larchive , le texte est fondamentalement une srie ouverte dans lordre des matrialits. Srie des v ariantes (les attestations fort div erses des discours de De Gaulle, par ex emple), srie des rcritures (celles des Contes de Perrault, pour rester dans le domaine dtude de lquipe dUte Heidman et de Jean-Michel Adam), srie des traductions, srie des commentaires, etc. Lun des dfis les plus ex citants pour les sciences du tex te consistera penser, et outiller, ce caractre pluri-sriel. Pour commencer, lannotation dporte, la rfrence hy pertex tuelle (liens) doit faire lobjet dattentions particulires, en tout cas env ers certains corpus, donc env ers certains v ersements aux archiv es, et dune v rification : ces mises en srie peuv ent-elles tre

29

30

31

http://semen.revues.org/1995

6/11

/ /

Quelle place pour les sciences des textes dans l'Analyse de Discours ?
ex ploites dans le cadre des env ironnements dex ploration dont je v ais maintenant parler ? En dautres termes, ces env ironnements seront-ils adapts la srialit configurationnelle des tex tes ?

5. Les problmes de lexploration


32

33

Tous ces aspects sont en fait assez troitement lis. Mme une fois configurs av ec tout ce que cela implique dj dinv estissement humain, ex pert, les tex tes restent lettre morte tant que nest pas pense la lecture darchive au sens mme o lentendait, lappelait Michel Pcheux 13 dans son dernier trajet. Ils le restent dv idence, comme si leur statut numrique v enait emblmatiser cela ( rebours de la trompeuse apparence naturaliste de lisibilit du tex te crit dans notre civ ilisation plurisculaire de limprim). Pour lire dsormais, il faut en tout tat de cause un ordinateur, un logiciel, un cran. V oy ons donc le logiciel Depuis une bonne dizaine dannes dans le champ francophone et latin, une bifurcation sest opre entre les env ironnements qui se v eulent danalyse de donnes textuelles (ADT) ou analyse de textes par ordinateur (ATO) pour renv oy er la terminologie de nos amis de Montral. Le choix se porte sur le statut donn aux rsultats des analy ses, toutes plus ou moins lies aux mthodes statistiques multidimensionnelles, le plus souv ent dessence benzcriste, et ce statut lui-mme renv oie au ty pe dapplication v ise. Certains logiciels ont v isiblement pour fonction de produire des rsultats comme tels, des rapports, des rsums automatiques, des interprtations cl en main. Ils se sont tous plus ou moins industrialiss, tant au plan procdural que quant leur mode de diffusion et leurs rapports lactiv it acadmique se sont tout naturellement distendus, ainsi qu la recherche scientifique. Leur rapport lAnalyse de Discours reste nanmoins plus complex e quil ny paratrait sur ce seul critre, puisque tous sont rests en prise av ec un certain niv eau de commande sociale, ft-ce dans le cadre peu conflictuel de la cogestion des conflits dintrt (ressources humaines, clientle, qualit, etc.). Mais ce rapport nest gure de ma comptence ici.

Ads not by this site 34

35

36

37

Les autres env ironnements ont tous, des degrs div ers, intgr la v iv e et v itale ex igence des sciences humaines : la prsence du tex te porte de clic . Lorsque Philippe Schepens dans le sminaire du Ceditec 14 v oque une interface de consultation sommaire, quil a d construire dans son laboratoire pour obtenir un accs minimal sa propre base, aux ressources quil tait lui-mme en train de collecter et qui lui dev enaient, au fur et mesure de leur massification, proprement inaccessibles, il formule le paradox e que jai soulev sur les fonts baptismaux du ple Archive, Bases, Corpus la MSH de Besanon, qui se creuse entre de plus en plus d'information disponible, de moins en moins d'accessibilit rationnelle . Certes, la solution moy en terme nest pas de construire une interface chaque fois que lon collecte un corpus. Cependant, tant la philosophie ex plicite que les usages observ ables sur ces logiciels (Hyperbase,SATO, Lexico3 , Taltac 15 ) me semblent encore priv ilgier laspect terminatif des rsultats danaly ses statistiques, au dtriment dune v ision rellement alternativ e, qui est celle-ci : lAnalyse de discours comme prax is interdisciplinaire, la lecture darchive qui est son noy au mthodologique, ncessitent un env ironnement logiciel qui se prsente ouv ertement et sorganise concrtement comme un dispositif dexploration. Lessentiel nest pas de dcorer des rsultats objectifs , obtenus par lapplication dalgorithmes impassibles des donnes rputes les plus fiables et reprsentativ es possible, par des citations pertinentes (les phrases significativ es , par ex emple, qui sont recrutes statistiquement pour tre censes concentrer au mieux les proprits de classes calcules). Si le retour au texte se limite cela en substance, il ne mrite pas encore pleinement son nom. Lessentiel me semble au contraire de configurer un nouv eau mode de lecture du plein tex te en employ ant les ex tractions que permet la statistique probabiliste, comme des outils dorientation (cest--dire, bien sr, de slection : comment dissocier les deux ?). Cest cela qui ma demble sduit par ex emple dans lAnaly se Factorielle des Correspondances. Sans doute par got et formation personnelle, jai v u immdiatement, dans le premier nuage de points que jai obtenu de mes donnes sur Les Fleurs du mal, une cartographie. Et je nen dmords pas. Il y a beaucoup de nav et dans la thse que jai soutenue, y compris dans la manire dont jy ai dcor les graphes, en faisant inconsciemment des sortes de cartes dles au trsor, mais il y a une affirmation de base qui me guide encore aujourdhui : tous ces rsultats (listes

http://semen.revues.org/1995

7/11

/ /

Quelle place pour les sciences des textes dans l'Analyse de Discours ?
ordonnes par lcart-rduit lquidistribution, concordances plus ou moins tendues, fentres de contex tes, dictionnaires de formes et de lemmes, segments rpts, nuages de points de lAFC) forment un atlas (ctait le titre du v olume 4 de la thse) et trouv ent l lessentiel de leur utilit. Cest pourquoi jaccorde une importance centrale la dy namisation de ces rsultats dans le cadre mme du dispositif dex ploration. Astartex , que je dv eloppe, a pour seule particularit par comparaison aux logiciels v oqus ci-dessus que toutes les listes, concordances et nuages de points sont cliquables en v ue dune poursuite de la lecture. Certes, une part de linterprtation des nuages de points doit se faire selon les canons de la science benzcriste, quil faut rgulirement rex poser si lon souhaite contenir lillusion magique lie ces projections fascinantes pour ainsi dire par elles-mmes. Mais quand il sagit, notamment, de lanaly se de grandes matrices de cooccurrence lex icale, on peut prdire sans grand risque quil sera impossible deffectuer un dpart rationnel entre les facteurs de lexique (les supposes contraintes de la langue) et les facteurs de vocabulaire (les thmatisations spcifiques). Linterprtation reposera donc sur la poursuite de lex ploration, guide par ces rsultats : recherche et concordance des contex tes croiss, comparaison de graphes, etc. De mme que les diffrentes modalits dinterface doiv ent toutes tre cliquables (cest--dire ergonomises comme des carrefours de lex ploration), de mme doiv ent-elles pouv oir tre informes par lhistorique rcent, et cest le sens des colorations que permet Astartex . Par ex emple, un nuage AFC color par les cooccurrents forts dun item interrog 16. Fondamentalement, il sagit donc dune interface de consultation, comme en ex ige toute base substantielle. Mais dune part je prfre cent fois le terme dexploration celui de consultation, qui v oque une ressource statique et lillusion dune sorte de matrise a priori du chercheur sur son corpus, alors que lexploration est un processus beaucoup plus dialectique et productif. Car dautre part, mme si le logiciel est fix e, linterface laquelle je trav aille se construit graduellement en senrichissant des rsultats quelle produit et trav erse. Tout cela est bien sr insolemment optimiste dans sa formulation, cest--dire pour lessentiel, programmatique . Comme DiaTag pour la pr-configuration, Astartex nest quun prototy pe de laboratoire destin illustrer ce programme. Et surtout, il est hautement probable quau fur et mesure que nous construirons les outils dex ploration, limmensit et la complex it des espaces ainsi ouv erts saccrotront et continueront donc de dcourager toute ambition incontrle de matrise absolue des donnes, de sy nthse stabilise. Relativ ement lespace gographique (dans ses conceptions classique et rationaliste du moins), lespace des matrialits tex tuelles du discours est dune plasticit qui dfie lentendement fini. Notre propos est donc en tout cas, finalement, trs modeste. Nous ne cherchons en aucun cas mettre au jour des secrets que les tex tes renfermeraient, ni dliv rer des preuv es irrfutables, mais bien au contraire fav oriser un dialogue interprtatif plus riche av ec larchiv e entendue comme matrialit du discours.

38

39

40

41

Conclusion
42

43

Cest pourquoi, aux dnominations de lexicomtrie, stylomtrie, logomtrie, textomtrie , nous opposons fermement celle dexploration textuelle . Certes, ce programme se traduit empiriquement de manire moins holistique ; il faut notamment rserv er une phase autonome ltiquetage lex ical et morphoflex ionnel, ce qui empche de fondre ad optimum ltablissement des tex tes et leur ex ploration dans un continuum dialectique. Mais pour ce qui est de la mtrique (les calculs et leurs rsultats), nous proposons de la tenir fermement en lisire. Ce que les sciences des tex tes peuv ent et doiv ent apporter lAnaly se de Discours (cest--dire ce quelles doiv ent sapporter mutuellement, trav ailler ensemble) cest justement ce mix te dambition heuristique et de prudence hermneutique que jespre av oir fait v iv re ici.

Ads not by this site

Bibliographie
A DAM J-M., 2 005, La linguistique textuelle : introduction lanaly se textuelle des discours, Colin. A DAM J-M., Heidm ann U., 2 006 , Sciences du texte et analy se de discours : enjeux dune interdisciplinarit, Slatkine.

http://semen.revues.org/1995

8/11

/ /

Quelle place pour les sciences des textes dans l'Analyse de Discours ?
CHARAUDEAU P., MAINGUENEAU D., 2 002 , Dictionnaire danaly se de discours, Seuil. CONDAMINES A., 2 005, Sm antique et corpus, Herm s-Lav oisier. DTRIE C., SIBLOT P., V RINE B., 2 001 , Term es et concepts pour lanaly se du discours. Une approche praxm atique, Champion . GUILHAUMOU J., MALDIDIER D., ROBIN R., 1 9 9 4 , Discours et archiv e. Mardaga. GUILHAUMOU J., 2 001 , La connexion em pirique entre la ralit et le discours : Siey s et lordre de la langue , in Marges Linguistiques n1 . GUILHAUMOU J., 2 005, O v a lanaly se de discours ? Autour de la notion de form ation discursiv e , in Marges Linguistiques n9 . HABERT B., N AZARENKO A., SALEM A., 1 9 9 7 , Les linguistiques de corpus, Colin. LEBART L., SALEM A., 1 9 9 4 , Statistique textuelle, Paris, Dunod. MALDIDIER D., 1 9 9 3 , Linquitude du discours , in Configurations discursiv es : Sem en8, Pey tard J. & Moirand S., ds. Les Belles-Lettres. MOLINI G., CAHN P., 1 9 9 4 , Quest-ce que le sty le ? PUF. MULLER Ch., 1 9 9 2 (A), Initiation aux m thodes de la statistique linguistique, Paris, Champion . . MULLER Ch., 1 9 9 2 (B) : Principes et m thodes de statistique lexicale, Paris, Champion RASTIER F., 2 001 , Arts et sciences du texte, PUF. PEYTARD J., MOIRAND S., 1 9 9 3 , Configurations discursiv es : Sem en 8. Les Belles-Lettres. SARFATI G-E., 2 003 , LAnaly se du discours et la question du texte : lhorizon du sens com m un et de la doxa , in LAnaly se du discours dans les tudes littraires, R.Am ossy & D.Maingueneau, ds. Presses Univ ersitaires du Mirail. V IPREY J-M.,1 9 9 7 , Dy nam ique du v ocabulaire des Fleurs du m al, Champion .

V IPREY J-M., 2 006 , Philologie num rique et herm neutique intgrativ e in Sciences du texte et analy se de discours : enjeux dune interdisciplinarit dir. Jean-Michel Adam & Ute Heidm an. Slatkine (pp. 51 -6 8) WILLIAMS G., 2 005, La linguistique de corpus, Presses Univ ersitaires de Rennes.

Notes
1 Soulign par lauteur. 2 Rappelons que Jean-Michel Adam rdite ici son liv re de 1 9 9 9 , sous le m m e titre Linguistique textuelle m ais av ec un nouv eau sous-titre (lancien tait Des genres de discours aux textes ), ce changem ent tant explicit en deux endroits de lav ant-propos. Page 3 , Adam annonce un positionnement thorique et mthodologique qui situe rsolument la linguistique textuelle dans lanalyse de discours. Page 5, il explicite le changem ent de paradigm e : Le terme analyse textuelle , que je remplace par celui d analyse textuelle des discours [] (soulign par lauteur) 3 A paratre dbut 2 007 . 4 Voir en substance Muller 1 9 9 2 A et B, et Lebart & Salem 1 9 9 4 . 5 Toutes ces citations sont extraites des sites Internet du consortium LexisNexis http ://www.lexisnexis.com et http ://www.lexisnexis.fr. 6 En contre-exem ple, citons Le Monde diplomatique, dont ladm inistration sest m ontre dem ble trs attentiv e nos propositions (restes ce jour inabouties) de trav ail com m un sur les archiv es num riques. Au m oins la presse crite est-elle seulem ent indiffrente. Les grands diteurs littraires, eux, ont opt pour un attentism e juridiquem ent trs agressif. 7 Nous av ons m m e eu la surprise de trouv er bon nom bre de graphies corrom pues dans le plein-texte. 8 Pour lessentiel et dans le m eilleur des cas, la num risation au form at im age (PDF) un ry thm e plus ou m oins soutenu, qui am liore certes le confort daccs, m ais interdit les fonctions textuelles lm entaires. Entendons-nous bien : le form at PDF doit tre prcieusem ent conserv , puisque nul ne peut prdire dans quelle m esure une recherche aura probablem ent recours tel ou tel lm ent de la surface graphique saisie. 9 Textopol par le CEDITEC de Paris-1 2 (Sim one Bonnafous, Pierre Fiala) EA 3 1 1 9 , http ://textopol.free.fr, Politext par lUMR 6 02 9 Bases Corpus Langages http ://www.unice.fr/ILF-CNRS/politext. Voir lentretien av ec Pierre Fiala dans ce m m e v olum e. 1 0 Laissons pour linstant de ct le problm e, tout aussi dlicat, de lim portation des lm ents dtablissem ent dj affects antrieurem ent, notam m ent dans la sphre littraire. 1 1 Nous laissons encore de ct la problm atique de la m ise en correspondance av ec les m anuscrits. 1 2 Notons au passage la nav et difficilem ent soutenable du term e de reconnaissance linguistique, nav et m ilitante qui ne fait pas peu pour cliv er les approches en suscitant de faux-v rais conflits 1 3 Maldidier 1 9 9 3 . 1 4 Sm inaire du v en dr edi 6 ja n v ier 2 0 0 6 , coordination Pierre Fiala : Traitem ents autom atiss des discours politiques. Objets nouv eaux, nouv elles m thodes . 1 5 Hyperbase (Etienne Brunet) lUMR 6 02 9 Bases Corpus Langages , SATO (Franois Daoust) au centre ATO de lUniv ersit du Qubec Montral, Lexico3 (Andr Salem ) au SYLED EA 2 3 9 0 de Paris-3 , Taltac (Sergio Bolasco) LUniv ersit La Sapienza http ://www.taltac.it. 1 6 Voir en com plm ent au sujet de ces colorations, les contributions que jai faites dans Condam ines 2 005, Adam & Heidm ann 2 006 , et dans le num ro de Langages Unit(s) du texte , coordonn par Dom inique Legallois, paratre en 2 007 , ainsi que m es com m unications aux Journes internationales dAnaly se statistique de Donnes Textuelles (JADT) de 1 9 9 8 2 006 , accessibles sur la rev ue en ligne Lexicometrica http ://www.cav i.univ -paris3 .fr/lexicom etrica.

Related Searches:

Broadway Theatre Musical Stage Prose Poems Legally Blonde Charles Pierre Baudelaire Poetry And Prose French Poet First Broadway Musical
http://semen.revues.org/1995

9/11

/ /

Quelle place pour les sciences des textes dans l'Analyse de Discours ?

Elle Woods

Pour citer cet article


Rfrence lectronique

Jean-Marie Viprey, Quelle place pour les sciences des textes dans l'Analyse de Discours ? , Semen [En ligne], 21 | 2006, mis en ligne le 28 avril 2007, consult le 06 fvrier 2014. URL : http://semen.revues.org/1995

Auteur
Jean-Marie Viprey Laboratoires ATST/Laseldi - Universit de Franche-Comt
Articles du m m e auteur

Le Discours potique et son vocabulaire [Texte intgral] Benveniste sur les mots et leur jonction
Paru dans Semen, 33 | 2012

Pour un traitement textuel de lallitration [Texte intgral]


Paru dans Semen, 12 | 2000

Espaces des Fleurs du Mal [Texte intgral]


Paru dans Semen, 11 | 1999

Jean-Michel Adam, La linguistique textuelle. Introduction lanalyse textuelle des discours [Texte intgral]
Paru dans Semen, 32 | 2011

Prsentation [Texte intgral] Le Discours de presse au XIXme sicle : pratiques socio-discursives mergentes
Paru dans Semen, 25 | 2008

La rcusation clinienne [Texte intgral]


Paru dans Semen, 14 | 2002

Droits dauteur
Presses universitaires de Franche-Comt

OpenEdition:
OpenEdition Books OpenEdition BooksLiv res en sciences humaines et sociales Liv res diteurs En sav oir plus Rev ues.org Rev ues.orgRev ues en sciences humaines et sociales Les rev ues En sav oir plus Calenda CalendaAnnonces scientifiques Accder aux annonces En sav oir plus Hy pothses Hy pothsesCarnets de recherche Accder aux carnets En sav oir plus Lettre & alertes LettreS'abonner la Lettre d'OpenEdition Alertes & abonnementsAccder au serv ice OpenEdition Freemium Rechercher dans la rev ue dans OpenEdition

Titre :

Semen
Revue de smio-linguistique des textes et discours En bref : Rev ue de smio-linguistique des discours et des tex tes

http://semen.revues.org/1995

10/11

/ /

Quelle place pour les sciences des textes dans l'Analyse de Discours ?
A semiotics and discourse analy sis journal Sujets : Langage, pistmologie et mthodes, Linguistique, Littratures, Mthodes quantitativ es, Mthodes qualitativ es Dir. de publication : Andre Chauv in-V ileno diteur : Presses univ ersitaires de Franche-Comt Support : Papier et lectronique EISSN : 1 957 -7 80X ISSN imprim : 07 61 -2990 Accs : Open access Freemium V oir la notice dans le catalogue OpenEdition DOI / Rfrences Citer cette rfrence Du mme auteur Articles du m m e auteur dans la rev ue Jean-Marie V iprey Le Discours potique et son v ocabulaire [Tex te intgral] Paru dans Semen, 33 | 201 2 Pour un traitement tex tuel de lallitration [Tex te intgral] Paru dans Semen, 1 2 | 2000 Espaces des Fleurs du Mal [Tex te intgral] Paru dans Semen, 1 1 | 1 999 Tous les tex tes TwitterFacebookGoogle +

Ads not by this site

http://semen.revues.org/1995

11/11

S-ar putea să vă placă și