Sunteți pe pagina 1din 319

Bibliothque numrique de lenssib

Le numrique : impact sur le cycle de vie du document, Actes du colloque EBSI-enssib du 13-15 octobre 2004

SAVARD, Rjean Directeur de la publication

SAVARD, Rjean (dir.) Le numrique : impact sur le cycle de vie du document, 13-15 octobre 2004, Montral [en ligne]. Lyon : cole nationale suprieure des sciences de linformation et des bibliothques, 2004, 318 p. Format PDF. Disponible sur : <http://www.enssib.fr/bibliotheque-numerique/notice-1223>

Ce document est tous droits rservs . Il est protg par le droit dauteur et le code de la proprit intellectuelle. Il est strictement interdit de le reproduire, dans sa forme ou son contenu, totalement ou partiellement, sans un accord crit de son auteur.

Lensemble des documents mis en ligne par lenssib sont accessibles partir du site : http://www.enssib.fr/bibliotheque-numerique/

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Table des matires


Partie 1 - Le cycle de vie : ses drives et sa rgulation
Le temps dans le cycle de vie du document numrique Genevive LALLICH-BOIDIN Jean-Paul METZGER Florence SDES Le cadre de rfrence gouvernemental en gestion intgre des documents au Gouvernement du Qubec : entre la loi et la technique Yves MARCOUX Pourquoi les technologies numriques ne sont pas la solution la gestion des documents dentreprise Carol E.B. CHOKSY 33 17

3
4

Partie 2 - Imprim, visuel, numrique : interactions et harmonisation

41

N sur papier, lev numrique : la vie prcaire des documents issus de la production cinmatographique 42 James M. TURNER Impact du numrique sur le cycle de vie dun document dappui rdactionnel : le conducteur du Journal Tlvis de TF1, France Clarisse HOLIK 53

Partie 3 - Le document sans mutations


Le deuil de la mmoire Anne-Marie BERTRAND Dure de vie du document : ralit et rve de Gutenberg nos jours Raphale MOUREN

62
63

79

Partie 4 - Le traitement documentaire


Les traitements documentaires automatiques et le passage du temps Lyne DA SYLVA Le document numrique dynamique : une toile filante dans lespace documentaire Katarzyna WEGRZYN-WOLSKA Processus de documentarisation dans les Documents pour lAction (DopA) Manuel ZACKLAD

108
109

127

139

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 1/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Partie 5 - Complexits de la gestion des documents numriques


La conservation des bases de donnes Marc LEBEL Cycle de vie du document lectronique et obligations de conservation Najoua DJERAD Rle de lauthenticit dans le cycle de vie des documents numriques Eun G. PARK Impact de lorganisation des documents lectroniques sur linterprtation de linformation organique et consigne dans un contexte de gestion dcentralise Sabine MAS

176
177

183

200

206

Partie 6 - Documents numriques : problmatiques de disponibilit et d'accs


La revitalisation numrique du patrimoine littraire territorialis Jean CASENAVE Christophe MARQUESUZA Pantxika DAGORRET Gaio MAURO Apports du numrique au cycle de vie des documents papier : les documents scientifiques dans le rseau universitaire franais Chrifa BOUKACEM-ZEGHMOURI Patrimoine et numrisation : la mise en contexte du document Isabelle WESTEEL

223
224

259

285

Partie 7 - Numrique et perspectives africaines


Bibliothques et numrique : enjeux pour lAfrique Bernard DIONE

305
306

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 2/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Partie 1 - Le cycle de vie : ses drives et sa rgulation

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 3/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Le temps dans le cycle de vie du document numrique


Genevive LALLICH-BOIDIN Laboratoire Ursidoc - Universit Lyon 1 Jean-Paul METZGER Laboratoire Ursidoc - Enssib Florence SDES IRIT (UMR 5 505 CNRS)
Rsum : Cet article propose une modlisation capable de rendre compte des diffrentes dimensions temporelles portes par un document. Aprs la dfinition de la notion de document, nous introduisons trois univers : l'univers sociohistorique, l'espace documentaire et l'univers du discours. Chacun d'eux contient sa propre dimension temporelle.

Mots cls : document numrique, dimensions temporelles, univers social, espace documentaire, univers discursif.
Abstract: This paper deals with different aspects of time included in any digital documents. We define the notions of document and digital document . Then, we propose a model which enables to reflect all the dimensions included in a document. It consists in three universes: the socio-historic universe, the document space and the discourse one. Each one includes its own temporal dimension.

Keywords: digital document, time dimensions, social universe, document space, discourse universe.

Les volutions technologiques donnent naissance de nouveaux objets pour lesquels il nexiste pas de dnomination. Souvent, par analogie avec les objets existants, on reprend une dnomination courante laquelle on ajoute des qualificatifs. Il en est ainsi du terme document numrique . Nous nous interrogeons ici sur la dfinition de la notion de document, et partant sur

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 4/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

celle de document numrique , puis sur celle despace documentaire et de sa dimension temporelle. La dimension temporelle saffirme diffrentes tapes du cycle de vie du document, a fortiori numrique, comme la gestion de bibliothques numriques, la synchronisation de mdias, la gestion de versions, la prise en compte de la rdaction collaborative, lannotation, ou encore avec des requtes ou manipulations portant sur le temps oui, mais lequel ? Qui concerne-t-elle ? Les conservateurs (bibliothques, muses, archives), aussi bien que les interprtes (archologie, histoire, philosophie, littrature), les ralisateurs (informatique, PAO, conception de contenus multimdia) et les diffuseurs (responsables de portails, diteurs, moteurs de recherche). Quels sont les problmes ? La prennit des supports et la datation des documents posent le problme de lintgrit, tant au niveau du support que du contenu, de lidentit et de lgalit. Le temps rgit lantriorit avec les droits dauteurs, la proprit intellectuelle ou artistique. La (re)construction du contexte est galement un enjeu, pour la lecture, et la relecture. Les reprsentations du temps interviennent donc non seulement dans la synchronisation des modes et les interactions, mais aussi pour le nommage (versions, identit, dtection de changements), ainsi que dans les rfrences et citations. Aprs une proposition de dfinition dans la deuxime section de cet article, nous prsenterons les trois univers et leurs liens dans la troisime partie. La quatrime abordera la dimension temporelle induite par ces univers, puis la dernire les enjeux du numrique, avant de conclure.

Essai de dfinition Un document est une relation quaternaire asynchrone entre un auteur, un discours, un support et un lecteur : L lit un D produit par A sous la forme S . Une telle dfinition exprime de faon statique que le discours inscrit sur son support constitue le mdia au travers duquel le lecteur entre en contact avec lauteur. Elle dit aussi que seuls les discours inscrits sur un support sont mme de devenir documents. Un document est donc ncessairement un objet matriel. De plus, cet objet est un construit ou artefact, la fois uvre dauteur, et ouvrage de scripteur car lauteur du discours nest pas toujours celui qui linscrit sur le support. Cette dfinition dit enfin quuvre et ouvrage ne sont quune face du document, lautre face tant construite par le lecteur. Cest le lecteur qui dote cet artefact du statut de document. Ainsi, un support de discours devient document par celui qui en reoit le discours, celui qui linterprte. On peut donc postuler

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 5/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

quun document sans lecteur nest pas un document. Un document sans lecteur est assurment un objet construit, mais tant quil na pas atteint un destinataire, il reste lettre morte. Ainsi, la Grotte Chauvet est devenue document le jour o des splologues lont dcouverte. Ceux-ci en ont fait une premire lecture qui a t reprise et amplifie par des archologues. La notion de lecteur recouvre une grande diversit de statuts : cest avant tout une entit humaine prise dans sa dimension sociale. Elle peut tre individuelle ou collective, elle peut revtir des fonctions diverses : conservateur, groupe de chercheurs, critique littraire Le nombre de lecteurs crot avec la longueur de la chane dautorits, au long de laquelle on value, slectionne, dite, diffuse, conserve. Un mme artefact ntant pas considr de la mme faon par des lecteurs diffrents, il y a donc au-del dun mme artefact autant de documents que de lecteurs. Un document numrique est un document qui a pour caractristique dtre sur un support lectronique, dtre perceptible via la technologie numrique. Carla Hesse (Hesse, 1996) voit dans les nouvelles technologies non pas un nouveau mdia de communication mais un nouveau mode de communication. Or, le support numrique interdit lenregistrement dobjets du monde comme les specimens dun herbier, et se limite alors lenregistrement de reprsentations de ces objets. Autrement dit, il ne peut reprsenter que des symboles, symboles soumis un encodage. Au sein des documents numriques, il existe de nombreuses variantes issues du mode de codage des donnes, ou des programmes. Pour un lecteur donn, un document na de valeur documentaire que parce quil participe un ensemble documentaire plus vaste, une collection, dans lesquels il sinsre et quil vient complter. Cest cet agencement qui conduit poser la dfinition de lespace documentaire. Lespace documentaire est le lieu o sorganisent les collections. Aux rles classiques dauteur et de lecteur, viennent se superposer dautres fonctions : slection, description, structuration, diffusion. Lespace documentaire apparat alors comme un support matriel de mdiation entre les deux ples de la communication, support qui autorise la dsynchronisation entre les deux processus de production-nonciation dune part, et de rception-interprtation dautre part, car sa matrialit lui permet de traverser le temps. Cest un lieu de mmoire, de structuration, de mise en relation de documents. Matrialit et rmanence donnent lespace documentaire ce rle de transmetteur. Cest donc un moyen de communiquer en traversant le temps. Lespace documentaire est constitu de documents mais aussi de fragments de documents, ou units documentaires, quelle que soit leur granularit. Cet espace documentaire, aussi nomm corpus ou collection, se caractrise par quelques proprits essentielles :
homognit dans le sens o les documents partagent des proprits semblables, sont soumis des rgularits (rgles, contraintes). Cette homognit peut se

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 6/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

manifester suivant quelques-uns des critres suivants : documents manant dune mme source (personne morale ou physique), documents mis pendant une priode donne, documents traitant dun mme sujet, et plus gnralement documents runis dans un mme but ; dynamisme du contenu, car le corpus possde, limage dune mmoire, une dimension diachronique, historique : ajout, suppression, modification de documents, que cette opration soit dicte par des instances extrieures, ou quelle rsulte dun choix ; dynamisme de la structuration : au sein de cet espace, il existe une cohsion interne, cohsion qui se manifeste par des liens entre documents, et mme entre fragments de documents, ces liens pouvant tre explicites (rfrencement, commentaires) ou (re)construits et pouvant donc voluer.

EXEMPLE 1 - Considrons une srie de journaux tlviss recueillis sur une chane pendant une priode donne. Lhomognit de ce corpus rside dans trois critres : genre tlvisuel, source, priode. Chaque journal tlvis est pourtant un assemblage de squences, dont certaines sont des extraits provenant dautres documents tourns des priodes diffrentes, dans des lieux diffrents, par divers ralisateurs. Ces derniers documents sintgrent naturellement dans la collection initiale. Il en est de mme de tous les commentaires ultrieurs que susciteraient les journaux tlviss recueillis initialement. EXEMPLE 2 - Considrons des articles scientifiques rassembls par un chercheur, autour dun thme. Chaque article sappuie sur des travaux antrieurs qui suivant leur degr dassimilation seront ou non cits. On peut par exemple voquer dsormais la thorie de la relativit sans citer explicitement les travaux dEinstein. La collection volue pendant la dure dactivit du chercheur. Il peut y ajouter ses propres productions. Un document peut donc tre considr comme une relation quaternaire asynchrone entre lauteur (ventuellement un collectif), le discours (mettant en jeu plusieurs modes d'expression), un support (multiple), un lecteur (pluriel), selon des points de vue statique (discours (uvre) + support (ouvrage) = mdia) ou dynamique (le document nexiste que parce quil y a lecteur). Un document numrique est un document sur support numrique (ce qui implique : matriel, logiciel et norme ad hoc).

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 7/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Les trois univers Un corpus documentaire joue le rle de mmoire matrielle constitue par des personnes dans le cadre dune activit. Un tel corpus, de faon analogue une mmoire, volue dans le temps, au gr des ajouts, des oublis (effets de mode, effacements volontaires ou accidentels), des restructurations internes. Ces fonctions sont excutes par des personnes sinscrivant dans lunivers social, intermdiaires entre les auteurs des documents et leurs lecteurs. Par ailleurs, un corpus ne doit son existence qu lactivit dont il est la trace. Cela sapplique aussi bien aux collections duvres picturales ou dobjets runis par un amateur dart (Barnes, Winthrop, Andr Breton) ou par un muse, quaux liasses de documents lis un projet dingnierie dans une entreprise, quaux archives dun chercheur dune quipe de recherche ou dun collectionneur (Duc dAumale). Cette activit sancre ncessairement dans lunivers social auquel les acteurs appartiennent. Cet univers sapprhende relativement au contexte dans lequel le corpus est exploit. Il peut se limiter un nom de projet au sein dune entreprise mais verra au cours du temps et des volutions de lentreprise la prcision de son contexte senrichir (projet XXX, men au sein de la division YYY telle priode). Cependant, certains corpus sont appels tre exploits dans des sphres beaucoup plus larges que celles qui les ont produits, aussi la reconstruction du contexte social dans lequel ils furent construits savre-t-elle indispensable comme pralable leur interprtation. Enfin, un corpus est constitu de documents contenant des textes, des figures, des enregistrements de paroles, dimages animes Ceux-ci sont perus comme tant des discours aux yeux de celui qui en prend connaissance. Chaque discours est porteur de son univers de discours reconstruit par linterprtant (le lecteur). Et alors se tissent des liens internes et externes cet univers de discours : des liens internes entre les univers des diffrents discours dans l intertextualit , des liens entre le contexte social qui habite linterprtant et les univers de discours. Les consquences peuvent avoir une porte variable : elles peuvent tre sources de nouveaux liens entre documents du corpus, donner naissance de nouveaux documents qui seront joints ce corpus, et aller jusqu modifier lunivers sociohistorique. Pour ces raisons, nous posons lexistence de trois univers distincts :
lespace documentaire, celui o se situe le corpus documentaire, lunivers social ou plutt sociohistorique, celui du contexte dans lequel sinscrivent les acteurs, quils soient auteurs, lecteurs, collectionneurs , et lunivers cr par le discours ou univers discursif : un discours (un texte , un film considr dans leur contexte de production) construit un univers, avec ses objets, leurs tats, les vnements qui les affectent.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 8/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Lespace documentaire est au centre du dispositif. En effet, il a pour spcificit dtre le seul perceptible dans sa matrialit. Bien sr, en tant quartefact, il ne peut tre observ comme lest un lment naturel, mais plutt interprt.

Figure 1. Reprsentation des trois univers et de leurs interactions.

Espace documentaire et univers sociohistorique

Un espace documentaire, en tant que trace dune activit sociale, pourrait tre intgr dans lunivers sociohistorique. Or, nous considrons quun espace documentaire de par sa matrialit nest pas de la mme nature que les faits sociaux qui constituent lunivers social : il est de nature symbolique. Il en est la trace sensible. Il permet donc une communication asynchrone comme le permet la mmoire dun humain qui se trouve en situation de tmoigner de faits quil a vcus. Les documents permettent ainsi linstar de la mmoire humaine daccorder au discours quils renferment une autonomie temporelle par rapport lunivers social, le document permettant une dsynchronisation entre le temps de lauteur et le temps du lecteur. En dautres termes, lenregistrement dnoncs sur support matriel (hors de la mmoire humaine) leur permet ainsi de saffranchir du temps social. Lespace documentaire est en outre le lieu o les documents se positionnent les uns par rapport aux autres (socit documentaire intertextualit), o tout document est une reprise au moins partielle de documents qui le prcdent. En outre, le document traverse le temps social, mais il est soumis comme tout objet destruction, dtrioration, dcouverte. Cet espace, qui recouvre les fonds ou collections rsultant dune activit humaine, ventuellement plus ou moins automatique , est donc un espace dynamique voluant au gr des ajouts/suppressions, des

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 9/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

modifications, annotations, versions, et enrichi par extraction de fragments, liens entre documents (fragments ou granules), citations, rfrences. Enfin, le constat dune dualit simpose : lespace documentaire contribue la construction de lunivers social, pourtant aucun des documents le composant ne peut tre interprt sans tre inscrit dans le temps social.
Univers sociohistorique et univers du discours

Lnonciateur et linterprte appartiennent tous deux lunivers social et le partagent, mais grce lunivers documentaire, ils peuvent dsynchroniser leur activit. Lunivers documentaire recle des discours. Ces discours jouent un double rle vis--vis de lunivers social : ils en sont le reflet, et participent sa construction. Car le sujet interprtant a pour vocation de reconstruire lunivers social de lauteur partir des discours. La distinction entre univers discursif et univers social sillustre aisment au travers de la distinction entre journaux et mmoires . Pour reconstituer lunivers social dune priode coule, on peut sappuyer sur les documents produits cette poque, les journaux intimes ou publics, ou sur les documents crits plus tardivement par ceux qui ont vcu cette priode, les mmoires. Dans le cas des journaux, le temps de lnonciation, celui o le locuteur parle, sidentifie au temps social des vnements relats. En contrepartie, le lecteur-interprtant daujourdhui doit reconstruire cet univers pour pouvoir situer les noncs dans leur contexte de production. Dans le cas des mmoires, le temps de lnonciation est diffr par rapport celui des vnements relats. Le temps de lnonciation est donc distinct, car diffr, de celui des vnements. La reconstruction du contexte seffectue en deux tapes par deux acteurs diffrents. Lauteur doit reconstruire le contexte social de ses souvenirs, tandis que le lecteur doit reconstruire lunivers dans lequel lauteur a crit. Ces mmoires, censes recueillir les souvenirs d'une vie, sont tournes vers le futur, car il s'agit de construire l'image transmettre aux gnrations suivantes. Le discours peut donc concourir la construction de lunivers sociohistorique, et lunivers sociohistorique se construit partir des discours.

Les trois temps Chacun des trois univers que nous venons de distinguer est fondamentalement historique : des vnements sy produisent, des successions et des dures y sont observables. Et chacun de ces univers a une temporalit qui lui est propre. Il suffit pour sen convaincre dexaminer les procds narratifs de rminiscence (flash-back) ou danticipation, ou les discours sur le temps cosmique.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 10/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Le temps documentaire

Le temps documentaire est marqu par les vnements et changements qui affectent le champ documentaire : ajouts (apparition de nouveaux documents), destruction, modification, mais aussi par les vnements qui en affectent lorganisation via les restructurations (ajout/suppression de liens). Au lieu de considrer que lunivers documentaire n'est fait que d'une srie d'vnements homognes (les interprtations individuelles), on distingue, dans l'paisseur du corpus, plusieurs plans d'vnements possibles :
plan des units documentaires elles-mmes dans leur mergence singulire ; plan de l'apparition des modalits d'interprtation, des concepts, des choix stratgiques ; plan de la drivation de nouvelles rgles de formation partir de rgles qui sont dj l'uvre (exemples : apparition dun nouveau document impliquant une rorganisation dun corpus documentaire, changement de paradigme interprtatif entranant un ramnagement du matriel documentaire).

Relvent, entre autres, du temps documentaire, une syntaxe : cest la succession des chapitres, des paragraphes, des phrases, des mots dun texte ; ou encore celle des plans, des squences et des scnes dun film. Dautre part, toute unit documentaire tant considre comme un vnement surgissant dans un champ dinterprtation, le temps de lecture, libre ou impos, fait partie intgrante du temps documentaire. Le temps documentaire nest pas superposable au temps social, il nobit pas la chronologie rgissant lvolution sociale. Il est, encore moins, la traduction de la temporalit de la conscience humaine. Ainsi, la dcouverte en lan 2000 dune nouvelle uvre de Shakespeare, est un vnement se produisant dans le champ documentaire (inscription linventaire) qui naffecte que trs peu lunivers social.
Le temps du discours

Lunivers de discours est un ensemble de domaines o des objets peuvent apparatre, des relations peuvent tre assignes. Ce sera par exemple un domaine d'objets matriels possdant un certain nombre de proprits physiques constatables, des relations de grandeur perceptible ; ou, au contraire, ce sera un domaine d'objets fictifs, dots de proprits arbitraires, sans instance de vrifications exprimentales ou perceptives ; ce sera un domaine de localisation spatiale et gographique, avec des coordonnes, des distances, des relations de voisinage et d'inclusion ; ou, au contraire, un domaine d'appartenances symboliques et de parents secrtes. Ce sera un domaine dobjets qui existent dans ce mme instant et sur cette mme chelle de temps o se lit le document,

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 11/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

ou bien ce sera un domaine dobjets qui appartient un tout autre prsent : celui qui est indiqu et constitu par le document lui-mme, et non pas celui auquel le document appartient lui aussi. Lunivers de discours n'est point constitu de choses , de faits , de ralits , ou d'tres , mais de lois de possibilit, de rgles d'existence pour les objets qui s'y trouvent nomms, dsigns, dcrits ou reprsents, pour les relations qui s'y trouvent affirmes ou nies. Lunivers de discours est le lieu, la condition, le champ d'mergence, l'instance de diffrenciation des individus ou des objets, des tats de choses et des relations qui sont mises en jeu par le document lui-mme. Cet univers nest pas fig, il est soumis au changement, il est lieu dapparition de nouveaux individus, de nouveaux objets, et lieu de modification des relations entre ces individus, ces objets. Il est essentiellement temporel et cette temporalit est construite par le document lui-mme : le temps du discours est inscrit par lauteur et (re) construit par le(s) lecteur(s). Les travaux de philosophes comme Michel Foucault (Foucault, 1969) et Paul Ricoeur (Ricoeur, 2000), ceux de linguistes comme mile Benvniste (Benvniste, 1966) ou Catherine Fuchs (Fuchs et Lonard, 1979) donnent une ide de ltat des rflexions en la matire.
Le temps sociohistorique

Le temps social, contrairement aux deux prcdents, ne relve pas a priori dune construction intellectuelle, il est celui dans lequel sinscrit une socit humaine. Il est fait dvnements et de dures, projets sur un calendrier. Ces dures portent des dnominations distinctes suivant les disciplines : res gologiques, priodes historiques, ges de la vie. Si nous devons admettre que le temps social est un donn a priori, de nombreux vnements qui le scandent sont nanmoins trs dpendants de certains documents, qui participent leur construction ; lannonce par les mdias dune mesure gouvernementale peut dclencher des mouvements sociaux, lapparition de nouveaux tmoignages peut modifier une dcision de justice, la sortie dun nouveau film peut influencer les comportements sociaux, etc.
Relations entre les temps

Le temps documentaire li lunivers mdian (mdiat) de notre reprsentation est un temps ponctu dvnements. Il relve dune logique qui lui est propre. Il est articul au temps de lunivers social grce aux diffrentes personnes qui participent son volution, personnes qui, avec leur niveau dautorit, agissent en fonction du contexte social. Dans lunivers social, le temps de lauteur prcde toujours celui du lecteur (y compris pour la littrature danticipation ou de sciencefiction). Rciproquement, des vnements sociaux peuvent changer la nature dun document. Nous empruntons lexemple qui suit H. Hudrisier : les lections prsidentielles de 1969 et 1974

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 12/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

modifient profondment, transforment linterprtation que lon peut faire dune photo de presse reprsentant le prsident de la Rpublique C. De Gaulle en prsence de G. Pompidou et V. Giscard dEstaing (prise avant 1969). Si parfois le discours permet de crer un univers autonome, il peut aussi se construire partir du temps social au moyen des dates, ou de rfrence des vnements. En outre, il peut aussi se rfrer dautres discours de lunivers documentaire. Pour illustrer les articulations entre les trois temps, que tout document reflte de manire plus ou moins intrinsque ou explicite, considrons par exemple les descriptions ci-aprs qui refltent toute la richesse et lambigut des multiples facettes de cette description temporelle :
un film documentaire Dure : 52 minutes en 25 i/s Production : 30 juin 2002 Diffusion : 25 septembre 2002 vnement relat : 1er tour des lections, 20 avril 2002 Priode tournage : 20 mars-20 avril un article scientifique Reu en novembre 1996, revu en avril 1998 Accept en juin 1998, publi en dcembre 1998 Citant des articles de 97 et de 98 (aprs prise en compte de demandes de rvision) Lu en 2004

Les enjeux du numrique Le support numrique des documents ne bouleverse pas cette distribution en trois univers. Il nous incite mieux en comprendre lorganisation, les contours, les caractristiques et rend ncessaire sa description, sa caractrisation et sa modlisation. En effet, nombreux sont les problmes auxquels il nous faudra apporter des solutions :
la facilit avec laquelle on peut diffuser des copies de fichiers numriques contribue la ngation de la distance temporelle, car le temps dacheminement nest plus proportionnel la distance parcourue ; le numrique oblige discrtiser les continuums et autorise la dlinarisation, donc les ruptures, crant ainsi de nouveaux parcours dans les espaces documentaires ; les espaces documentaires sont constitus de fichiers quil convient de nommer, mais lheure actuelle aucune norme ne rgit le nommage des fichiers, si ce nest que sur un mme espace disque on ne peut avoir deux fichiers portant le

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 13/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

mme nom. De ce fait un mme document, peut porter des noms diffrents, selon le lieu o il rside et selon son contexte de lecture et dusage (par exemple, le nom de la confrence laquelle il est soumis dans le contexte de lauteur de larticle, par opposition au contexte du prsident du comit de la confrence qui lidentifiera par le nom de lauteur), et ce contrairement aux rgles qui prsident l'attribution de numros standards pour les documents papiers, comme l'ISBN (International Standard Book number) et l'ISSN (International Standard Series Number). Ce problme a t identifi par l'International DOI Foundation (IDF), qui propose d'uniformiser le nommage des fichiers au moyen d'un DOI, Digital Object Identifier : Un Identificateur d'objet numrique diffre des pointeurs en usage sur internet comme l'URL parce qu'il identifie un objet comme une entit part entire, et non simplement l'endroit o est situ cet objet 1 . (IDF, 2004). Cette solution devrait rsoudre terme la question de dsignation des documents dposs afin d'en protger la proprit intellectuelle. Mais lui chappent encore nombre de documents changs au sein d'organisations.

Il devient ncessaire dans de nombreuses applications informatiques lies la conservation numrique, la restitution et diffusion de documents de prendre en compte la dimension temporelle (Jourdan et alii, 1998). Ce faisant, les fondements du raisonnement logique atteignent un haut niveau de complexit (Bellini et alii, 2000). Or il nous faut admettre quune dimension temporelle unique ne permet pas de construire un modle apte reprsenter les interactions entre les trois univers prsents ci-dessus. Les applications informatiques ne traitent quune dimension temporelle, linaire, et chercher inscrire dans cette dimension des vnements qui ressortissent des trois univers reste une problmatique ouverte (Roisin, Sdes, 2004). Ainsi, certaines applications informatiques intgrent la prise en compte du temps dans la gestion et linterrogation de fonds documentaires (Aramburu, Berlanga, 2001). Lanalyse de la situation modliser les conduit naturellement distinguer lvnement documentaire (parution dun article par exemple) de lvnement social dont le document traite. Malgr cette distinction justifie, le modle propos se limite une seule dimension temporelle : le temps de la physique, continu et linaire, avec ses repres arbitraires et inoprants que sont les dates. Le temps de la narration, par exemple, avec ses tirements et ses suspensions temporels, avec ses retours dans le pass et ses intrusions dans le futur ne se prte gure cette continuit et cette linarit. Les formalismes logiques restent limits, et la reprsentation courante du temps reste linaire (temps mto, temps technologique, construits disciplinaires, etc.).
1.

A DOI differs from commonly used internet pointers to material such as the URL because it identifies an object as a firstclass entity, not simply the place where the object is located.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 14/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Reste construire un formalisme permettant de raisonner et calculer sur ces trois dimensions temporelles au moins, et sur dventuelles interactions entre ces dimensions, intgrant une volution, des cycles et des priodicits diffrents sur chaque axe.

Conclusion Avant, aprs, vnement, succession, dure, pass, prsent, futur, devenir. Autant de termes qui rfrent cette notion trs complexe de temps. Il y a temps sil y a changement ; changement dun tat de choses, changement au sein dun univers. Le monde est tout ce qui arrive, crit L. Wittgenstein (Wittgenstein, 1990) en ouverture de son Tractatus logico-philosophicus, rfrence essentielle de la logique contemporaine. Nos trois univers, documentaire, discursif et social, ont en commun cette essence temporelle. Si ces univers sont distincts, ils relvent dordres diffrents, ils sont nanmoins solidaires et leurs temporalits respectives interfrent. Les modalits actuelles de linformation, et de la transmission (spatiale et temporelle) nous poussent nous interroger sur ces temporalits, qui constituent lune des cls de laccs la signification et au sens. Tout dispositif numrique dinformation et de communication ne peut aujourdhui ngliger le temps, et doit lapprhender dans toute sa complexit. Le cycle de vie du document numrique comprend, depuis la conception jusqu la disparition, son lancement, sa croissance, son extinction, lorigine est luvre, issue de la gense par lauteur, et de son appropriation par le lecteur. La filiation des discours par reprise dans dautres discours, et linscription dans la mmoire humaine, tisse une toile qui imprgne la mmoire collective. Le support numrique quant lui est inerte et sa destruction possible. Il a donc son propre cycle de vie (du disque vinyle au DVD, en passant par la cassette et le CD). Les lois conomiques interviennent (le pilon), le discours peut savrer obsolte, par exemple quand il est lui-mme li un artefact (cas de la documentation technique). Ainsi merge le paradoxe du document numrique. Lui dont la diffusion est amplifie, reproduit peu de frais, saffranchissant de la distance, des alphabets et des langues, voit sa prennit fragilise, par la double contrainte du support et du logiciel, et devient volatile voire phmre.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 15/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Bibliographie
ARAMBURU, M., BERLANGA, R., A temporal object-oriented model for digital libraries of documents , Concurrency and Computation: Practice and Experience, vol. 13, p. 987-1011, 2001. BELLINI, P., MATTOLINI, R., NESI, P., Temporal logics for real system specifications , ACM computing surveys, March 2000, vol. 32, n 1, p. 12-42. BENVNISTE, ., Problmes de linguistique gnrale, Paris, Gallimard, 1966. FOUCAULT, M., LArchologie du savoir, Paris, Gallimard, 1969. FUCHS, C., LONARD, A.-M., Vers une thorie des aspects, Paris, Mouton, 1979. GONORD, A. (d.), Le Temps : textes choisis, Paris, Flammarion, 2001. JOURDAN, M., LAYADA, N., ROISIN, C., Le temps dans les documents , Techniques de lIngnieur, Trait Informatique, H7228, 13 p., 1998. HESSE, C., Books in time , In the future of the Book, ed. by Nunberg, G., Berkeley, Los Angeles, University of California Press, 1996, p. 21-33. HOBBS, J.-R., A DAML Ontology of Time, University of Rochester, November 2002, <http://www.cs.rochester.edu/~ferguson/daml/20020830/daml-time-20020830.xml> [fvrier 2007]. MAINGUENEAU, D., Genses du discours, Bruxelles, Pierre Margada, coll. Philosophie et Langage , 1984. RICUR, P., La mmoire, lhistoire, loubli, Paris, Seuil, 2000. ROISIN, C., SDES, F., Temps et documents, numro de la revue Document numrique, vol. 8, n 4, Paris, Lavoisier, 2004. WITTGENSTEIN, L., Tractatus logico-philosophicus, Paris, Gallimard, 1990.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 16/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Le cadre de rfrence gouvernemental en gestion intgre des documents au Gouvernement du Qubec : entre la loi et la technique
Yves MARCOUX GRDS - cole de bibliothconomie et des sciences de linformation Universit de Montral
Rsum : La gestion de l'information est au cur des activits de toute organisation : la performance dune organisation dpend de son efficacit. La gestion des documents est une condition ncessaire (bien que non suffisante) la gestion de l'information. Depuis longtemps, les disciplines de la gestion documentaire et de l'archivistique ont mis au point et proposent des faons de grer les documents qui aident les organisations mieux grer leur information. Ces mthodes sont largement penses et dcrites pour le traitement de documents sur support papier. Depuis deux trois dcennies, cependant, les administrations ont de plus en plus massivement recours l'informatique pour la cration et la gestion des documents. Ce phnomne entrane une panoplie de problmes bien connus, que l'on peut synthtiser comme la prolifration, mal ou non contrle, de documents numriques de divers formats, statuts, natures et versions, sur les ordinateurs individuels ou institutionnels de l'organisation. Cette prolifration peut facilement mener une pitre performance de l'organisation dans la gestion de ses connaissances, la perte de documents importants, une contribution sousoptimale de l'organisation la prservation du patrimoine informationnel collectif de la socit et une faible confiance des partenaires d'affaires en la capacit de l'organisation de mener de faon satisfaisante des affaires en ligne. Face cette situation, le Gouvernement du Qubec, comme la plupart des grandes administrations publiques, dsire se doter d'une vision, de mthodes et d'outils pour mieux grer ses documents sur tous supports, incluant les supports numriques. C'est l'objectif principal du projet de Cadre de rfrence gouvernemental en gestion intgre des documents (CRGGID), que nous relatons dans cet article. Le projet a t soutenu financirement par le Secrtariat du Conseil du trsor (SCT) et les Archives nationales du Qubec (ANQ). Il s'est droul du printemps 2002 l't 2004. Les pistes envisages par le CRGGID se situent entre le lgal et la technique, et incluent des modles, des mthodes, des outils, des infrastructures pangouvernementales et un partage des responsabilits articuls autour du Dirigeant principal de l'information , qui viennent appuyer le processus de dveloppement des systmes administratifs gouvernementaux. Nous prconisons notamment la participation d'un responsable de la gestion documentaire la conception des systmes, et l'intgration de la notion d'enregistrement

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 17/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

institutionnel des documents dans les systmes eux-mmes et non comme processus spar d'archivage ds leur conception. Ces mthodes, pratiques et outils, ont t encapsuls dans une mthodologie gomtrie variable, qui offre des modles opratoires pour quelques cas de figure courants. Finalement, nous avons ralis deux cas d'application au ministre des Relations avec les citoyens et de l'immigration, qui ont servi dvelopper et valider certains volets de la mthodologie. Nous prsentons quelques-unes des recommandations l'intention du gouvernement issues du projet.

Travail conjoint avec Patrick Beaulieu, Arnaud D'Alayer, Jean-Franois Hamel, Christian Rmillard et Johanne Thibodeau.

Problmatique et objectif

Place de la gestion documentaire dans la gestion de l'information

Parmi toutes les activits de gestion, la gestion de l'information est une des plus difficiles dcrire prcisment et, encore plus, raliser. Toute personne fonctionnelle dans une organisation arrive manifestement grer tant bien que mal l'information dans son environnement immdiat. Mais mettre en place des mcanismes de sensibilisation, de planification et de contrle, pour arriver une gestion efficace et efficiente de l'information dans l'ensemble d'une organisation est une tche extrmement difficile. Proposer une mthode systmatique pour y arriver lest encore davantage et c'est un objectif qui a dfi les efforts de nombreux penseurs, chercheurs et praticiens pendant plusieurs dcennies. Pourtant, tout le monde est convaincu de la ncessit de bien grer l'information , quoi que cela veuille dire, ne serait-ce qu'en constatant les ravages produits par des problmes de communication ou une mauvaise circulation de l'information dans une organisation ou des groupes quelconques. Par exemple, dans les normes de qualit de la srie ISO-9000, les performances de l'organisation en matire de reprage de l'information sont cruciales. Et tout le monde veut une mthode pour arriver une bonne gestion de l'information. Le premier cueil rencontr par le courant d'efforts qui s'est attaqu systmatiser la gestion de l'information depuis l'arrive de l'informatique semble tenir la dmesure des espoirs placs dans la technologie. On vivait avec l'impression que la solution rsidait dans des investissements toujours plus grands en ressources technologiques (matriel d'abord, puis programmeurs, analystes, infrastructures rseau et logiciels ensuite). Il est maintenant gnralement admis que cette faon de concevoir les choses est un cul-de-sac. la rescousse se sont succds des courants comme la

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 18/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

programmation structure, l'orientation-objet et une multitude de mthodologies d'analyse, de modlisation, de dveloppement et d'valuation de systmes. Chacune de ces approches a apport son lot de bnfices, mais aucune ne s'est jamais avre tre LA solution, la grande dception de plusieurs. Graduellement, le monde de la gestion a fini par accepter qu'il n'y avait pas de panace et que la gestion de l'information devait tre aborde avec un mlange de pragmatisme et de mthodologie, mais surtout, en mettant l'accent sur les humains qui produisent et utilisent l'information plutt que sur les technologies qui les aident le faire. Aujourd'hui, parmi les avenues les plus prometteuses, quoique complexes (mais, encore une fois, il n'y en a pas d'autres !), on compte des courants comme la gestion du savoir ou des connaissances (knowledge management) et l'cologie informationnelle (information ecology) 2 . La gestion documentaire telle que nous la concevons ne se prsente pas comme une alternative ces courants, ni comme un dveloppement ou une extension de ceux-l. Elle ne s'offre pas comme une mthode complte et suffisante pour arriver une bonne gestion de l'information dans une organisation. Elle ne s'offre surtout pas comme une panace la gestion de l'information. La gestion documentaire est un minimum de bonnes pratiques de gestion de l'information explicite (consigne) d'une organisation, sur laquelle on peut btir une bonne gestion de l'information. C'est en quelque sorte une hygine de base que tout membre du personnel d'une organisation devrait pratiquer et qui garantit cette organisation une prise, une poigne d'accs minimale sur son information. Elle ne garantit en rien une bonne gestion de l'information, mais au moins, la rend possible. Dans l'absolu, la gestion documentaire n'est peut-tre pas essentielle une bonne gestion de l'information. En thorie, il se pourrait qu'une stratgie optimale de gestion de l'information, parfaitement bien adapte aux besoins spcifiques d'une organisation, puisse tre dveloppe sans la couche de base de la gestion documentaire. Cependant, s'il y a des priodes d'essais et erreurs, et si, pendant ces temps de ttonnements, le minimum correspondant la gestion documentaire n'est pas assur, il est possible que de l'information importante soit perdue. Or, dans un contexte juridique et patrimonial, il est primordial de ne jamais perdre totalement prise sur les ressources informationnelles brutes. Si l'on met en place une solide pratique de gestion documentaire, alors on peut loisir exprimenter diffrentes stratgies de gestion de l'information, sans craindre de perdre, dans l'exercice, de l'information importante. La gestion documentaire permet donc d'assurer une continuit, au travers des efforts dploys pour dvelopper des stratgies de plus en plus performantes de gestion de l'information.

Davenport, 1997.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 19/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Nature de la gestion documentaire

La gestion documentaire est un traitement de base appliqu des units structures et dlimites d'information consigne appeles documents , dans le but que l'information consigne produite ou reue par une organisation ne soit jamais perdue. Ainsi prservs, les blocs d'information que sont les documents peuvent tre rutiliss dans une stratgie de gestion de l'information plus sophistique et plus finement adapte aux spcificits de l'organisation. Par analogie, on pourrait dire que la gestion documentaire est la gestion de l'information ce que le guide alimentaire canadien est la gastronomie ou la science de la nutrition. Les premiers assurent la survie et une certaine hygine de base, les seconds font dans le dtail et le raffinement. Un corollaire de cette situation est que les mthodes et outils de la gestion documentaire demandent beaucoup moins d'ajustements fins pour tre applicables divers types d'organisations. C'est la raison pour laquelle une approche gnrale comme un cadre de rfrence, visant l'ensemble des ministres, organismes et agences du Gouvernement du Qubec, est pensable, malgr qu'elle propose des mthodes et outils passablement prcis. Ces smthodes et outils devraient tre applicables n'importe quel ministre, organisme ou agence avec un minimum d'ajustements. Cela dit, la dmarcation entre gestion documentaire et gestion de l'information n'est pas tranche au couteau et certains aspects de la gestion documentaire doivent tenir compte des particularits fines de l'organisation dans laquelle on l'implante. Il demeure cependant vrai que la dmarche peut tre passablement gnrique, plus en tout cas que pour la gestion de l'information. Fondamentalement, les objectifs de la gestion documentaire, pour une organisation sont 3 :
Mieux remplir sa mission ; Documenter les ententes qu'elle conclut avec ses partenaires, de faon pouvoir se dfendre en cas de litige ; Respecter de faon dmontrable les rgles de transparence et d'quit de la socit dans laquelle elle s'inscrit ; Contribuer au dveloppement du patrimoine informationnel de la socit dans laquelle elle s'inscrit. Le premier objectif, mieux remplir sa mission , peut se diviser en deux sous-objectifs : Rendre les changes d'information plus efficaces ; Rendre l'organisation plus intelligente , en lui donnant accs au bagage de connaissances et d'expriences qu'elle accumule au fil du temps.

La gestion documentaire est un domaine bien tabli dont les modles et mthodes sont prsents dans des ouvrages comme Sutton-1996, Couture-1999, Rousseau-Couture-1994, Roberge2002 et ISO-15489. Plusieurs concepts de ce domaine sont rutiliss dans CRGGID. Cependant, ils
3

Les objectifs numrs constituent une synthse de ce que l'on rencontre gnralement dans la littrature comme objectifs de la gestion documentaire.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 20/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

sont maintenant imbriqus dans un modle nouveau et plus directement adapt aux contextes technologique et lgal qubcois modernes. Dans toute la mesure du possible, nous avons rutilis les concepts existants du domaine, n'en introduisant de nouveaux qu'en l'absence de concepts quivalents dans le domaine.
Ncessit de la gestion documentaire

Pourquoi a-t-on subitement besoin de gestion documentaire, alors que cela fait vingt-cinq ans que l'on dveloppe des systmes informatiques et que l'on implante des outils bureautiques sans s'en soucier ? En fait, le besoin de gestion documentaire n'est pas nouveau et a toujours t trs grand. Cependant, jusqu' l'essor massif de la bureautique phnomne somme toute relativement rcent l'ensemble des tches qui constituent la gestion documentaire tait le plus souvent assur sans qu'on s'en rende compte. La gestion documentaire tait la responsabilit du personnel impliqu dans la production de documents. Les secrtaires, par exemple, taient des passages obligs pour la plupart des documents crs et reus. Ces personnes effectuaient sur les documents un traitement documentaire de base, qui leur confrait une existence organisationnelle et les rendait accessibles l'organisation. Lorsque la bureautique puis le courriel sont arrivs, beaucoup plus de personnes ont pu crer et recevoir de faon autonome des documents, sans avoir la formation ni la sensibilisation ncessaires pour effectuer la gestion documentaire. De toute faon, les mcanismes qui auraient pu rendre possible une gestion documentaire distribue pour faire face la dmocratisation de la cration de documents, n'taient pas en place. Les documents ont donc commenc se distribuer sur les disques rigides de tout un chacun ou sur des disques rseau mal organiss, sans que personne ne soit vritablement qualifi pour assurer la gestion documentaire. Voil pourquoi il faut maintenant se proccuper dlibrment de gestion documentaire. Ceux qui doivent se proccuper au premier chef de gestion documentaire sont les personnes qui conoivent les systmes administratifs de l'organisation, car c'est l principalement que sont crs et reus les documents. C'est dans ces systmes que l'on doit retrouver la gestion documentaire, sous forme de fonctionnalits intgres. Ensuite vient la responsabilit des utilisateurs de ces systmes, qu'il faut suffisamment former et sensibiliser pour qu'ils comprennent et effectuent bien les tches relatives la gestion documentaire dont ils sont responsables dans les systmes mis en opration.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 21/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Gestion documentaire et bases de donnes

Je suis responsable de la conception de systmes administratifs dans mon organisation, mais il s'agit d'applications informatiques utilisant des bases de donnes, o il n'y a aucun document ; je n'ai donc pas me soucier de gestion documentaire. On entend souvent cette affirmation, qui, malheureusement pour ceux qui la formulent, est fausse. Au Qubec, depuis 2001, la Loi concernant le cadre juridique des technologies de l'information (L.R.Q., c. C-1.1) dfinit le document comme tout ensemble d'information structur, dlimit et intelligible. Dans ces conditions, tout change d'information entre un humain et une base de donnes est un change de document, et un systme dvelopp autour d'une base de donnes gre, que ses concepteurs le veuillent ou non, des documents. Par ailleurs, le concept de document est trs prsent dans la loi. titre d'exemple, relevons que la loi que l'on appelle communment Loi sur l'accs l'information s'intitule en fait la Loi sur l'accs aux documents des organismes publics et sur la protection des renseignements personnels (L.R.Q., c. A-2.1). Ceci s'explique : en effet, l'change de documents est, pour la plupart des gens, l'archtype mme de la transaction d'affaires. Le recours au concept de document dans la loi ne fait que reflter cette ralit. Donc, mme si l'on ne conoit que des applications utilisant des bases de donnes, o il n'y a en apparence aucun document, le contexte lgal qubcois nous rappelle que nos systmes travaillent en fait avec des documents et qu'ils doivent tre conus en tenant compte, entre autres, des dispositions lgales qui concernent les documents, comme par exemple la loi sur l'accs aux documents des organismes publics que nous venons de mentionner.
Gestion intgre numrique et papier

Qu'est-ce que la gestion intgre numrique et papier ? C'est l'utilisation des mmes mthodes et outils pour effectuer la gestion documentaire des documents papier et des documents numriques. Par exemple, grer la correspondance du Premier ministre, tant sur papier que par courriel, avec les mmes outils (pour la recherche, les statistiques, etc.). Pourquoi une gestion intgre numrique et papier ? La Loi concernant le cadre juridique des technologies de l'information dfinit l'quivalence fonctionnelle de documents et affirme que des documents qui sont fonctionnellement quivalents ont la mme valeur juridique, peu importe leur support. Dans ce contexte, il est tout fait logique que les services gouvernementaux soient offerts aux citoyens dans la technologie de leur choix. Autrement dit, un citoyen pourrait se prvaloir d'un service tant avec des formulaires papier qu'avec des formulaires numriques envoys par rseau via des transactions en ligne. Cette approche est en accord avec le principe d'accessibilit

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 22/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

des services gouvernementaux, mais elle implique aussi que le document papier est loin de disparatre des systmes administratifs. Dans ces conditions, deux possibilits s'offrent au concepteur de systmes administratifs : la gestion intgre des documents numriques et papier, et leur gestion en parallle. Le CRGGID prend rsolument le parti de la gestion intgre, puisque, sauf dans des circonstances extrmement particulires, elle donne lieu des solutions beaucoup plus simples et faciles pour les utilisateurs. La principale source de difficults pour la gestion intgre est le fait que les documents papier sont habituellement grs au niveau de granularit correspondant au dossier, alors que les documents numriques sont naturellement grs individuellement, mme s'ils font partie d'un mme dossier. Une autre source de difficults est la ncessit d'avoir des dossiers hybrides, constitus la fois de documents numriques et de documents papier.

Problmes lis aux documents numriques Les objectifs mentionns dans cette section renvoient aux objectifs fondamentaux de la gestion documentaire prsents la section Nature de la gestion documentaire . Depuis longtemps, les disciplines de la gestion documentaire et de l'archivistique 4 ont mis au point et proposent des faons de grer l'information qui, en rgle gnrale, permettent aux organisations d'atteindre les objectifs mentionns. Ces mthodes sont largement penses et dcrites pour le traitement de documents sur support papier. Depuis deux trois dcennies, cependant, dans la poursuite de l'efficacit des changes d'information (objectif 1.1), les administrations ont eu de plus en plus massivement recours l'informatique pour la cration et la gestion de leur information. Ce recours grandissant l'informatique, combin au dveloppement fulgurant de la microinformatique dans les annes 1980 et 1990, a entran la dmocratisation de la cration de documents. Cette dmocratisation a, son tour, amen une prolifration de documents (numriques) de divers formats, statuts, natures et versions sur les disques rigides des ordinateurs individuels dans l'organisation. De nombreux documents chappaient carrment l'organisation, puisque celle-ci ignorait parfois mme leur simple existence. Mme quand l'organisation connaissait l'existence des documents, l'autonomie confre aux individus par les nombreux outils bureautiques disponibles leur permettait, d'une part, de crer des documents dans une panoplie de formats diffrents et, d'autre part, de nommer, organiser et dcrire ces documents comme ils le voulaient, sans rgles uniformes. Il tait donc extrmement difficile de mettre en place des mthodes uniformes de gestion
4

Au Qubec et au Canada, la gestion documentaire est habituellement considre comme faisant partie de l'archivistique, qui est alors dite intgre , c'est--dire se proccupant du cycle de vie complet des documents.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 23/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

pour l'ensemble des documents. L'essor des rseaux et du courriel avec pices jointes, dans les annes 1990, a encore empir la situation, en encourageant la multiplication des copies et versions des documents, sans fournir d'alternative la gestion essentiellement individuelle des documents sur les disques rigides individuels ou rseau. En l'absence de mesures spcifiques pour en contrer les effets ngatifs, cette situation amne :
Une pitre performance de l'organisation en gestion des connaissances (objectif 1.2). En effet, toute connaissance vhicule dans les documents perdus ou conservs mais difficilement reprables, doit tre recre. La possibilit de perdre des documents relatifs ses ententes d'affaires et, en particulier, des preuves qui pourraient servir se dfendre en cas de litige (objectif 2). Mme lorsque les documents ne sont pas perdus, leur valeur juridique pourrait tre diminue par l'impossibilit de dmontrer une rigueur suffisante dans la gestion globale des documents. Une faible confiance des partenaires d'affaires en la capacit de l'organisation de mener de faon satisfaisante des affaires en ligne bases sur l'change de documents numriques. Pour un gouvernement envisageant de dvelopper des services en ligne pour ses citoyens (que ce soit pour des raisons politiques ou pour augmenter l'efficience de la prestation des services), cela peut signifier une difficult faire adopter massivement ces services par les citoyens. Une contribution sous-optimale de l'organisation la prservation du patrimoine informationnel collectif de la socit (objectif 4).

Grard Blanc soulignait rcemment que cet tat de choses prvaut encore dans bien des organisations et met en vidence le besoin d'imposer une gestion corporative aux donnes conserves sur les disques rigides des ordinateurs individuels des organisations. Le manque de contrle de scurit et de mcanismes systmatiques de sauvegarde sont, entre autres, les raisons invoques. La prolifration de documents numriques sans gestion systmatique affecte donc ngativement la quasi-totalit des objectifs d'une bonne gestion de l'information au sein d'une organisation. Au Gouvernement du Qubec, bien que des efforts ponctuels soient dploys depuis une dizaine d'annes pour mettre en place des mcanismes de gestion systmatique des documents numriques (parfois, une gestion intgre numrique et papier), l'opinion d'experts porte penser qu'actuellement, globalement dans l'ensemble du gouvernement, des pertes importantes surviennent aux niveaux de la gestion des connaissances et de la prservation du patrimoine informationnel collectif :

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 24/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

En ce qui concerne la gestion des connaissances, cela voudrait dire qu'un temps prcieux est utilis par le personnel de la fonction publique pour retrouver des documents mal grs (en particulier, mal dcrits ou entreposs au mauvais endroit), ou carrment pour recrer la connaissance consigne dans de tels documents parce qu'on ne russit pas les retrouver ou qu'on ne sait pas qu'ils existent. Pour ce qui est de la prservation du patrimoine informationnel collectif de la socit qubcoise, mentionnons titre d'exemple le fait qu'actuellement, aucune mesure systmatique n'est prvue pour le versement aux ANQ des documents numriques des ministres et organismes gouvernementaux qubcois aprs leur vie utile. Les mesures existantes ne couvrent que les bases de donnes (et non les documents pris un par un) et ne prvoient pas de versement comme tel, seulement une approbation par les ANQ des procdures de conservation permanente adopte par l'organisme pour ces bases de donnes. On peut comprendre que, dans ces conditions, la protection et la mise en valeur systmatiques du patrimoine informationnel qubcois des fins historiques ne sont probablement pas optimales.

Sans que cela ne constitue un problme immdiat, il est clair que le peu de confiance que pourraient inspirer des services gouvernementaux en ligne sans gestion documentaire rigoureuse pour l'appuyer, pourrait freiner l'adoption de ces services par les citoyens lorsque de tels services seront instaurs.
Objectif

L'objectif principal du Cadre de rfrence gouvernemental en gestion intgre des documents (CRGGID) tait d'laborer des outils conceptuels et mthodologiques aptes encadrer le travail de dveloppement des systmes oprationnels du Gouvernement du Qubec (systmes informatiques, administratifs ou autres) de telle faon que les objectifs mentionns la section Nature de la gestion documentaire soient atteints, dans le contexte actuel d'informatisation et de virtualisation grandissantes. Il s'agissait principalement d'laborer une mthodologie de mise sur pied de systmes de gestion intgre des documents sur tous supports pour le Gouvernement du Qubec, adapte ses besoins et ses orientations technologiques, et conforme aux meilleures pratiques en cours dans le monde. Certaines hypothses de travail devaient galement guider les travaux, notamment :
L'utilisation gnralise de XML pour la reprsentation des donnes numriques au gouvernement. L'utilisation gnralise des schmas XML du W3C pour la modlisation des donnes numriques au gouvernement.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 25/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

L'existence et disponibilit d'un registre-rfrentiel gouvernemental de schmas XML, conforme au modle du cadre d'affaires lectroniques ebXML <http://www.ebxml.org/>, pour la publication et le partage des modles de donnes numriques en usage au gouvernement. L'existence et disponibilit d'un rpertoire gouvernemental pour la consignation des habilitations (permissions d'accs et d'actions) et des certificats de cls publiques des employs du gouvernement. L'existence et la disponibilit d'une infrastructure cls publiques gouvernementale pour la gestion de certificats permettant le chiffrement et la signature numrique cryptographique cls publiques des donnes numriques.

Le projet a t soutenu financirement par le Secrtariat du Conseil du trsor (SCT) et les Archives nationales du Qubec (ANQ). Il s'est droul du printemps 2002 l't 2004. Le Groupe dpartemental de recherche sur les documents structurs de l'Universit de Montral (GRDS) en a t le matre d'uvre. Le projet s'inscrivait tout naturellement comme suite consquente du Chantier en ingnierie documentaire (1997-1999) 5 et du projet XML en route au Gouvernement du Qubec 6 galement ralis par le GRDS.

Aperu de la mthodologie labore

Modle gnral de la gestion documentaire

La mthodologie labore est base sur un modle gnral de la gestion documentaire. Le modle est original et a t dvelopp conformment trois principes :
La poursuite des objectifs fondamentaux de la gestion documentaire prsents la section Nature de la gestion documentaire . L'utilisation des concepts de document et de dossier comme objets de base pour l'change d'information dans la socit. Nous ne parlons jamais directement de gestion de l'information, mais plutt de gestion de documents (ou de dossiers). Tel qu'expliqu prcdemment, la gestion de l'information peut tre dveloppe par-dessus la gestion documentaire. La conception du document comme lment de soutien aux affaires, de Glushko et McGrath 7 . Le fonctionnement du modle est pens en termes de facilitation des relations d'affaires qui surviennent entre des partenaires d'affaires.
5 6

Parent, 2000. Marcoux, 2001. 7 Glushko-McGrath, 2002.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 26/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Le modle est bti sur cinq lments :


des notions gnrales de document et de dossier, convenant aussi bien au numrique qu'au papier ; la notion d'enregistrement institutionnel des documents, tant numriques que papier ; des outils et infrastructures gouvernementaux pour la gestion documentaire ; des modles normaliss et rutilisables dans le dveloppement de systmes informatiss ; des responsabilits claires et reconnues relativement la gestion documentaire au gouvernement.

notre connaissance, c'est la premire fois que tous ces lments se retrouvent articuls en un modle gnral de gestion documentaire. Le recours une telle innovation tait ncessaire cause de la diversit des lments et hypothses pris en compte. notre avis, terme, la plupart des administrations publiques dans le monde devront avoir recours un modle de ce genre, incluant essentiellement les mmes lments, avec des diffrences possibles dans le dtail, en particulier dans le dtail des choix technologiques. Le modle prvoit notamment :
L'tablissement d'un profil minimal de mtadonnes pour tout document gouvernemental, en srie (issu d'un processus administratif codifi et automatis) ou isol (cr ou reu en dehors d'un processus codifi et automatis). La dfinition d'une fonctionnalit de service d'enregistrement institutionnel pour tout document gouvernemental, isol ou en srie. Cette fonctionnalit s'assure que le profil minimal de mtadonnes est respect et doit rencontrer certaines exigences en termes de scurit de l'information enregistre (conservation, contrle d'accs, etc.). Cette fonctionnalit doit permettre, en gnral, l'enregistrement de documents papier et de documents numriques, de mme que de dossiers hybrides (comportant des documents papier et numriques). Elle doit aussi gnrer un identifiant universel (une adresse permanente universelle) pour chaque document. L'intgration de la notion de document et de la fonctionnalit d'enregistrement institutionnel dans les systmes administratifs informatiss eux-mmes (et non comme service d'archivage spar) ds leur conception. Le dveloppement de services d'enregistrement de documents isols intgrant un service d'enregistrement institutionnel (exactement de la mme forme que pour les documents en srie). Ces services ont pour but de favoriser la prise en charge

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 27/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

institutionnelle des documents isols le plus tt possible : ds ou aprs leur cration ou rception. Ces services doivent clairement offrir des avantages marqus pour les utilisateurs, puisque l'enregistrement institutionnel de leurs documents leur demandera un effort ; cet effort doit tout naturellement tre rcompens par des avantages. Un exemple d'un tel avantage est la gnration d'une adresse universelle permanente du document, qui peut tre utilise par l'utilisateur pour signaler son document tout correspondant d'affaires dans le monde (sous rserve des politiques d'accs). Un autre avantage serait la tenue d'un registre de consultation ( audit ) du document, registre consultable par l'utilisateur. Encore un autre avantage serait l'enrichissement de la description (mtadonnes) du document par un expert en gestion documentaire de faon le rendre mieux reprable dans l'organisation (sous rserve des politiques d'accs). La spcification des politiques d'autorisation selon la norme XACML, tous les niveaux du gouvernement, et leur approbation et dpt auprs d'un organisme appropri, par exemple la Commission d'accs l'information. L'existence d'une autorit gouvernementale de nommage, responsable de l'attribution des identifiants de diffrentes entits, dont les units administratives gouvernementales et les services d'enregistrement institutionnel.

Ces caractristiques comportent plusieurs avantages, dont :


La possibilit de fdrer les services d'enregistrement institutionnel pour effectuer des recherches pangouvernementales. Le profil de mtadonnes minimal permet de faire des recherches intelligentes et pas seulement en texte intgral. Le profil de mtadonnes permet l'application du calendrier de conservation tous les documents, quels que soient leur nature, leur support et leur format.
Parcours mthodologiques

Une mthodologie s'applique un ensemble de problmes qui ne surviennent pas toujours dans les mmes circonstances. Un parcours mthodologique est une dmarche propose pour certains cas de figure strotyps . Dans la mthodologie du CRGGID, les parcours suivants sont identifis :
Conception globale d'entreprise (lien avec l'architecture d'entreprise). Intervention rtrospective, pour des documents en srie ou isols. Intervention en amont dans la conception d'un processus d'affaires. Migration d'un systme informatis existant. Intgration d'un systme papier existant. Gestion de documents isols.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 28/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Intgration d'un outil de gestion documentaire (LiveLink, SharePoint, etc.) avec la gestion documentaire d'entreprise. Introduction de la gestion documentaire autour d'un systme existant intouchable .

Il est noter que deux parcours ont pu tre dvelopps, dans le cadre de deux cas d'application raliss au ministre des Relations avec les citoyens et de l'immigration. Il s'agit de la gestion de documents isols et de la migration d'un systme informatis existant. Les autres parcours n'ont t qu'esquisss.
Aspects gnraux de la mthodologie

L'archivistique intgre recommande depuis longtemps l'intervention de responsables de la gestion documentaire (RGD) 8 ds la cration des documents. C'est la meilleure faon de s'assurer qu' toutes les tapes de leur cycle de vie, les documents aient les qualits ncessaires la saine gestion des connaissances et du patrimoine informationnel, la prservation des preuves et au respect des lois : l'authenticit et l'intgrit. Pour bien encadrer la cration des documents, il faut intervenir au moment de la conception des systmes. La norme ISO-15489, tout en pointant timidement dans cette direction, ne va pas jusqu' affirmer clairement qu'un RGD doit participer au processus de mise sur pied des systmes administratifs. Nous prconisons directement cette intervention la source. Concrtement, cela implique qu'un RGD doit participer activement au processus de dveloppement des diffrents systmes de l'organisation, ds l'tape de conception. notre avis, il n'y a aucune autre faon pour que les systmes dvelopps rencontrent pleinement les objectifs noncs la section Nature de la gestion documentaire . En termes de gestion du changement, il y a ici une double sensibilisation faire : d'une part, les informaticiens doivent accepter de donner la place requise aux RGD et s'approprier le langage de la gestion documentaire ; d'autre part, les RGD doivent apprivoiser le langage de la gestion informatique de l'information et du processus de dveloppement de systmes informatiques. La mthodologie du CRGGID pourrait, dans le futur, s'arrimer une mthodologie existante de dveloppement informatique, comme Macroscope (de DMR) ou une de ses variantes. Elle en constituerait un module amenant le concepteur poser les bonnes questions sur la conservation de l'information des fins juridiques et patrimoniales, et proposer une palette de solutions satisfaisantes.
8

Nous utilisons le terme responsable de la gestion documentaire pour dsigner tout professionnel responsable de gestion de documents au gouvernement. Il pourrait s'agir de personnes portant des titres divers, comme gestionnaire de documents , archiviste ou responsable de la gestion documentaire ou des ressources informationnelles .

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 29/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

La mthodologie est gomtrie variable , au sens o non seulement elle encourage tirer parti des infrastructures et services gouvernementaux si ceux-ci sont disponibles, mais o elle est galement applicable en leur absence.

Conclusion Les travaux effectus, en plus de dfinir un modle gnral de la gestion documentaire original et conforme aux contexte et orientations technologiques du Gouvernement du Qubec, dmontrent l'applicabilit du modle sur le terrain. Par contre, ils mettent en vidence le caractre novateur du modle et les changements que son adoption au sein de l'appareil gouvernemental prsuppose. Il apparat crucial de dvelopper et de faire adopter une vision gouvernementale globale de la gestion de l'information, ainsi qu'une stratgie de gestion du changement pour la concrtiser. Ce sont des tches dont le Dirigeant principal de l'information devrait appuyer fortement la ralisation, de concert avec le Comit sur la gestion du changement dj mis sur pied. Les travaux ont men la formulation de douze recommandations l'intention du gouvernement. Parmi les plus importantes, on compte :
Que le Gouvernement du Qubec fasse raliser une analyse cots/bnfices pour dterminer ses besoins rels en matire de gestion intgre des documents. Une estimation quantitative du volume des documents numriques grer dans les ministres, organismes et agences gouvernementaux, et des bnfices attendus d'une gestion intgre devrait tre incluse. L'analyse devra valuer l'tat de la situation et les initiatives actuels en matire de gestion intgre des documents, par rapport la capacit d'appliquer concrtement le CRGGID, afin de dgager un vritable plan d'action. Nous recommandons qu'une reconnaissance forte soit donne au poste de Dirigeant principal de l'information (DPI) et son rle cl dans la gestion de l'information et des connaissances au gouvernement. Le poste de DPI devrait tre dot de tous les pouvoirs et ressources ncessaires. Son rle et ses responsabilits devraient tre clairement noncs dans des textes gouvernementaux officiels. Nous recommandons de poursuivre le dveloppement et la validation de la mthodologie du CRGGID par la ralisation de nouveaux cas d'application, qui permettront de : Mettre l'preuve, parmi les infrastructures gouvernementales prconises, celles qui sont actuellement inexistantes, au moment o elles seront mises en opration. Vrifier l'efficacit des moyens prconiss pour mettre en uvre ces infrastructures.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 30/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Dvelopper et documenter d'autres parcours mthodologiques pertinents.

Remerciements L'auteur tient remercier Patrick Beaulieu, Arnaud D'Alayer, Jean-Franois Hamel, Christian Rmillard et Johanne Thibodeau, du GRDS, Ren Clroult et Marc-Andr Leclerc, des ANQ et Richard Parent, du SCT.

Bibliographie
BLANC, G., La Gestion corporative des informations locales, Direction informatique, mars 2004, p. 21-22. <http://www.directioninformatique.com/DI/client/fr/DirectionInformatique/Nouvelles.asp?id=36000&b Search=True> [fvrier 2007]. COUTURE, C., et alii, Les Fonctions de larchivistique contemporaine, Sainte-Foy, Qubec, Presses de l'Universit du Qubec, collection Gestion de l'information , 1999. DAVENPORT, T.-H., Information Ecology: Mastering the Information and Knowledge Environment, New York, Oxford University Press, 1997. GLUSHKO, R.-J., McGRATH, T., Document Engineering for e-Business, Proceedings of the 2002 ACM Symposium on Document Engineering, McLean, Virginia, USA, November 8-9, 2002, ACM, 2002. <http://doi.acm.org/10.1145/585067> [fvrier 2007]. ISO (Organisation internationale de normalisation), Records management , ISO 15 489 Information et documentation, partie 1 : Principes directeurs et partie 2 : Guide pratique , 2001. MARCOUX, Y., et alii, XML en route au Gouvernement du Qubec : recherche-consultation ralise pour le Secrtariat du Conseil du trsor du Qubec, Gouvernement du Qubec, 2001. [fvrier <http://www.services.gouv.qc.ca/fr/publications/enligne/administration/ingenierie/xml.pdf> 2007]. PARENT, R., Ingnierie documentaire. <http://www.services.gouv.qc.ca/fr/publications/enligne/administration/ingenierie/ingenierie_descriptio n.pdf> [fvrier 2007]. ROBERGE, M., L'Essentiel de la gestion documentaire, ditions Gestar, 2002.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 31/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

ROUSSEAU, J.-Y., COUTURE, C., Les Fondements de la discipline archivistique, Sainte-Foy, Qubec, Presse de l'Universit du Qubec, coll. Gestion de l'information , 1994. SUTTON, Michael J.-D., Document Management for the Enterprise: Principles, Techniques and Applications, New York, John Wiley & Sons, Inc., 1996.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 32/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Pourquoi les technologies numriques ne sont pas la solution la gestion des documents dentreprise
Carol E.B. CHOKSY Professeur associ, Institut de bibliothconomie et de sciences de linformation, Indiana University.

Je suis trs heureuse de vous prsenter aujourdhui un sujet qui me tient cur. Je madresserai vous avec ma casquette de consultante spcialise dans la gestion documentaire dorganisations mondiales couvrant des secteurs dactivit trs divers, puisquil sagit aussi bien dorganismes publics que de cabinets davocats, de services financiers ou dentreprises industrielles. Nes de ce travail que jeffectue au titre de consultante, les observations qui suivent sont nourries par mes changes avec dautres consultants et avec des socits de services technologiques spcialises dans la gestion documentaire. Les problmes que je vais aborder avec vous ne sont pas nouveaux ; ils sont simplement exacerbs par le numrique, considr tort comme la solution toutes nos difficults. La technologie a beaucoup facilit la cration et la diffusion des documents, mais il nexiste pas de technologie qui soit mme de grer de faon cohrente les autres phases du cycle de vie. Les technologies de gestion documentaire, les scanners et le courrier lectronique, ont spectaculairement amlior notre capacit produire des documents, les peaufiner, les diffuser, et cest si vrai quelles nous donnent limpression de grer cette masse documentaire. Dans lentreprise, elles ont en ralit cr un chaos archivistique autrefois inimaginable dans la sphre professionnelle. Ces technologies devenues dusage courant nous bercent dune illusion dordre et dautorit. Je me propose dexaminer avec vous les effets du numrique sur les phases de la cration et de la diffusion de documents, afin de mieux saisir les ramifications de ses technologies et les pratiques quelles induisent dans la ralit en ce qui concerne le stockage, la destruction et larchivage. Crer des documents est un jeu denfant. La simplicit des modes de diffusion multiplie les copies cres sous des formats diffrents et envoyes des adresses diffrentes. La facilit avec laquelle elles sont distribues dcourage toute tentative pour identifier, maintenir, protger et conserver une version digne de foi. Vu labsence de systme qui permettrait didentifier cette version faisant autorit, tant que le document est utilis activement, son maintien et sa protection sont tributaires des prfrences personnelles des employs qui il a t adress. Les innombrables copies cres sur les divers supports et formats disponibles ne passeront pas forcment toutes par les phases de destruction ou darchivage. Les archives tant souvent noyes sous un fatras de copies

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 33/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

prsentes et organises de toutes les manires imaginables, lvaluation des documents darchives sen trouve srieusement complique. Lexemple qui suit lillustre bien, je crois. Un grand cabinet juridique international ayant son sige New York sest aperu que certains de ses courriels taient rgulirement produits lors du rglement de litiges. Il a fait appel nous pour laider rgler ce problme. Nous avons dcouvert que depuis la constitution du dpt darchives lectroniques, la gestion des documents, lectroniques ou autres, tait tout simplement inexistante. Ce dpt mis en service en 1995, quelque chose prs, nayant jamais t correctement organis, tous ceux qui le consultaient devaient effectuer une recherche en texte intgral ou procder partir de lidentit des clients ; aucun index navait t tabli. Le dpt darchives papier tait incomplet, vu que plusieurs avocats se flicitaient de se passer compltement du papier. Nombre de fichiers papier contenaient nanmoins plusieurs exemplaires dun mme document, car chaque nouveau procs ou nouvelle transaction, tous les intresss envoyaient aux archives les copies mises leur disposition. Les documentalistes taient trop dbords pour faire autre chose quentasser tous ces exemplaires dans le dossier correspondant. Le courriel gr individuellement par chaque employ navait apparemment que peu ou pas de lien avec les autres documents en dpt. Dans la pratique, il y avait autant dexemplaires des courriels et des fichiers attachs que de destinataires. Les attributions du service de gestion documentaire de ce cabinet juridique ne concernaient que les documents sur papier. Les personnes qui y travaillaient ne connaissaient rien aux documents ni aux courriers lectroniques et ne sautaient pas, cest le moins quon puisse dire, sur les occasions den apprendre davantage. Essayons dabord de dbrouiller les difficults rencontres sur place. Dans ce cabinet, rien nest plus facile que de crer des documents. Les employs senvoient des messages instantans et des textos (SMS) pour communiquer entre eux et avec des personnes extrieures lentreprise, sans penser une minute au retentissement de ces pratiques sur la gestion documentaire. Ces messages ne disparaissent pas ; ils restent dans les mmoires de diverses organisations, celle par exemple de la compagnie de tlphone. Dans la sphre professionnelle les courriels sont des documents, mme sils ressemblent plus aux propos changs lors dune conversation qu des documents en bonne et due forme. Du fait de leur nature particulire, ils prolifrent un rythme alarmant. Au lieu dimprimer les documents et den distribuer des copies papier, les employs les envoient maintenant en fichiers attachs leur courrier lectronique, aprs quoi leurs destinataires les impriment, puis les lisent et les gardent 9 . En rgle gnrale, en effet, la plupart des employs impriment les fichiers attachs avant de les transfrer avec les courriels reus dans leurs dossiers lectroniques personnels. Beaucoup impriment galement les courriels et les classent dans leurs
9.

Abigail J. Sellen et Richard H.R. Harper, The Myth of the Paperless Office, Cambridge, Massachusetts, MIT Press, 2002, p. 14.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 34/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

dossiers privs au lieu dutiliser ceux de lentreprise. Les raisons avances varient, mais dans lensemble les gens prfrent garder sous la main un exemplaire de rfrence parce quils ne sont pas srs que les autres les conservent ou quils craignent dtre sanctionns sils ne rpondent pas assez vite aux points dvelopps dans le document. Dans la pratique, cela signifie quil ny a plus dexemplaire officiel du document, et pas non plus de service darchivage. Comme nous venons de le voir, la simplicit et la rapidit qui prsident la cration des documents ne sont gales que par leur vitesse de diffusion. Ces deux phases de la cration et de la diffusion ont dailleurs suscit lapparition de nouvelles catgories de documents, tels les courriels, les messages instantans et les textos . Sils remplissent les mmes usages que les documents traditionnels, contrairement ces derniers ils servent aussi des fonctions plus anciennes. Les discussions autour de la machine caf , comme on disait autrefois, saffichent dsormais par crit et circulent via le courrier lectronique ; les notes que lon se passe pendant les runions sont transmises par messages instantans ; les coups de fil pour organiser les rendez-vous ont t remplacs par le courriel et les messages instantans. Autrefois, lorsque des informations de ce type taient saisies sous une forme ou sous une autre, elles finissaient dhabitude dans la corbeille papier. Le problme est quelles sont aujourdhui saisies et stockes dans de nombreuses mmoires , y compris celles des mobiles multifonctions, et ne sont pas toujours gres par lentreprise. Puisque la cration et la diffusion sont si faciles, il devrait tre aussi trs simple dattraper linformation au lasso et de la parquer dans un enclos sr afin de grer son cycle de vie. cela prs quil faudrait dabord dterminer quelle copie, quelle version ou quel avant-projet il sagit de cibler. Savez-vous par exemple que la version du rapport Starr prsente sur papier au Congrs amricain nest pas la mme que celle qui circule sur lInternet 10 ? WordPerfect, le programme de traitement de texte utilis pour saisir le rapport, possdait une caractristique insouponne qui lors de la conversion au format HTML rtablissait les passages corrigs. Tandis que la version imprime tait soumise au Congrs, le grand public a pu dcouvrir la version HTML. Aucune des dfinitions des notions dauthenticit ou de preuve ne peut nous aider dcider laquelle est en fait la version officielle . Pour prendre un autre exemple, quelle est celle des deux versions fournies par le gouvernement Blair propos de lengagement de la Grande-Bretagne en Irak que vous auriez sauvegarde ? Celle qui a failli renverser le gouvernement par ses rvlations sur la rvision de lhistoire, ou celle expurge de ces renseignements 11 ?
10

Voir, par exemple, larticle de John Mintz et Nathan Abze, Glitches Altered Starr Report Online , Washington Post, 16 septembre 1998, p. A34 ; et le site <http://www.washingtonpost.com/wp-srv/politics/special/clinton/stories/document091698.htm> [fvrier 2007]. 11 Iraq Its Infrastructure of Concealment, Deception, and Intimidation (30 janvier 2003) ; voir lanalyse de ce document effectue par Glenn Rangwala sur le site <http://www.casi.org.uk/discuss/2003/msg00457.html> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 35/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Quid du cas o le seul exemplaire du document est stock par la compagnie de tlphone, comme tous les messages SMS ? Le contrat qui vous lie cette compagnie ne prvoit pas expressment quelle conserve cette information et aucune procdure technique ne vous permet de larchiver sous ce format, avec lensemble des mtadonnes adquates. Il nest dailleurs pas impossible que la compagnie de tlphone dclare tout net ne pas garder des copies de ces messages 12 . Supposons que vous soyez en mesure de trancher et que vous entriez en possession dune version accrdite du document. Garder une copie officielle suppose de confier un service particulier la responsabilit de grer le reste de son cycle de vie. Les employs dudit service matrisent-ils suffisamment loutil technologique et les particularits du cycle de vie du document concern pour prendre des dcisions en connaissance de cause ? Savent-ils combien il en existe de copies, o elles se trouvent et sur quels supports ? Prenons le cas dun document transmis lidentique, et visant amliorer un processus mtier au sein dune entreprise. Cette socit a pour habitude de pratiquer la destruction des copies papier et de traiter le double lectronique comme la version officielle. Lapplication de la procdure recommande amne dcouvrir une exception, et il faut donc crire lauteur du document pour lui exposer le problme. On imprime le document, on rdige la lettre, et on la lui envoie avec la copie imprime du document en lui demandant de rsoudre cette anomalie. Lauteur rpond ; il a trouv la solution et la rorganisation du processus mtier reprend, avec le double lectronique , mais la rponse, la lettre adresse lauteur et la copie imprime du document sont dment classes dans un fichier par un employ qui sait que ses performances sont values en fonction de son efficacit et de sa rapidit traiter les exceptions. Le service qui gre les doubles lectroniques est compos de personnes engages dans le processus mtier qui effectue les oprations quotidiennes en sappuyant sur les doubles lectroniques. Ces doubles, ou ces images, sont dtruits au bout de deux ans. Lemploy qui a class les copies papier fait partie dun autre groupe de travail uniquement charg de traiter les exceptions. Ces dernires sont archives pendant trois ans, de faon pouvoir tablir des rapports statistiques permettant de dterminer si le processus mtier responsable des oprations courantes fonctionne correctement, ou sil faudrait que le deuxime groupe de travail traite un nombre plus important dexceptions. Vous savez donc que la version officielle du document a t dtruite, comme le veut la rgle applique dans lentreprise. Mais tes-vous sr que le fichier des exceptions dans lequel a t
12

Associated Press, Think Before You Text : Wireless Messages May Show up in Court , CNN, 7 juin 2004 : <http://www.cnn.com/2004/TECH/ptech/06/07/text.messaging.records.ap/> (4 aot 2004).

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 36/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

classe la copie a galement t nettoy ? tes-vous seulement au courant de lexistence de ce double sur papier ? Ce dernier a-t-il lui aussi le statut de copie officielle 13 ? Que dire encore de toutes ces copies ralises pour convenances personnelles ? Le personnel est-il suffisamment form pour les dtruire en temps et en heure ? tes-vous suffisamment motiv par votre programme de gestion du personnel et les audits de qualit pour dterminer votre influence en la matire ? Faute de temps, dargent ou dintrt pour ces questions, votre entreprise, mme si elle relve du secteur public, ne gre pas comme il faudrait ces copies pour convenances personnelles. Le courrier lectronique savre cet gard particulirement compliqu traiter. Lorganisation mme du systme de courriel peut rendre impossible la gestion automatique des copies. Sil est rgi par le protocole IMAP (Internet Mail Application Protocol), avec rception des messages par un serveur central, chaque courriel nexiste en principe quen un seul exemplaire, avec un certain nombre de pointeurs. Sil lest par le protocole POP (Post-Office Protocol), avec envoi des messages au disque dur de chaque ordinateur, il en existe autant dexemplaires que de destinataires. Les fichiers attachs ne simplifient pas la tche. Mme si vous avez opt pour lIMAP, chacun peut choisir dimprimer ou de copier la pice jointe, ce qui signifie quil peut y en avoir autant dexemplaires que de destinataires. Lintgration des produits de gestion documentaire et de gestion du contenu au courrier lectronique est encore trs rcente. Les produits disponibles pour grer le courrier lectronique se rsument essentiellement aux dpts darchives qui ne permettent que des recherches en texte intgral et une ou deux priodes de rtention dune dure dtermine. Or, aujourdhui, tout le problme est que mme lorsque les systmes sont intgrs, les employs rechignent catgoriser et classer leurs courriels. La norme tats-unienne DOD 5015.2 est largement responsable de cette situation. Elle impose en effet quantit de fonctionnalits qui ravissent les archivistes mais ne prsentent aucun intrt pour lutilisateur final. Elle dicte ce quil faut faire, sans prciser comment. Pour passer le test, un produit exige parfois vingt-cinq manipulations de souris par lutilisateur final, sans quil clique jamais sur les zones de texte. Rsultat, lutilisateur final trouve donc des moyens de contourner ces produits pour se simplifier la vie. Noublions pas que le courriel se substitue aux conversations. En consquence, ce nest pas un document mais toute une conversation que lutilisateur final est cens catgoriser et classer. De plus, tous les participants cet change doivent ou devraient procder de la sorte. la fin des annes quatre-vingt-dix, les socits de gestion documentaire se plaignaient dj du fait que les
13

Vous devriez bien entendu savoir quil existe un fichier o sont classs les cas dexception traits dans lentreprise. Et, oui, la copie imprime constitue une version officielle qui fait partie de tout un dossier rang dans le fichier des exceptions traites.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 37/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

utilisateurs finaux faisaient tout leur possible pour viter de catgoriser des documents entiers. Le courriel et les textos ont encore amplifi le problme. Si vous saviez o se trouve chaque copie, vous seriez en mesure de prciser les rgles et les procdures visant toutes les dtruire. Vous pourriez mme crer, par le biais de lvaluation des performances, des motivations qui convaincraient les employs dappliquer ces rgles et procdures. Le personnel du service documentaire sy connat-il toutefois assez pour sassurer quun document a bel et bien t dtruit ou conserv comme il se doit ? Il y a des chances que non. La destruction au cas par cas pose entre autres le problme que les diffrents cas de figure envisags ne concernent pas toujours lensemble des documents gravs sur un mme disque. Une des solutions consiste utiliser les procds de migration et de conversion pour slectionner les documents provisoirement soustraits au couperet. Entre-temps, les anciens documents continueront dexister. On voit ainsi que la responsable du service documentaire doit autant se proccuper de dtruire que de conserver. Cest moins linformation conserve que celle quelles croyaient avoir dtruite qui vaut les plus gros ennuis aux entreprises, prives ou publiques. Le cabinet Arthur Andersen en est un bon exemple. Nous venons dexaminer le problme propre aux copies cres dans un environnement lectronique, mais il faut prendre un peu de recul pour envisager aussi des dfis dordre plus technique. Le plus important, en loccurrence, tient labsence de produit conu pour grer de A Z le cycle de vie dun document, quel quil soit. Les applications tactiques prvues, par exemple, pour les comptes clients, ne portent que sur une partie du cycle de vie. Ces produits saisissent limage du document, lassistent au cours du processus mtier, la gravent sur un disque lorsquelle nest pas souvent rfrence, et ly retrouvent jusqu ce que le moment soit venu de dtruire ce disque. Ils ne peuvent pas plus dtruire linformation que le document original. Pour ce faire, il faut craser et graver le disque entier processus qui requiert, outre une intervention humaine, un autre produit ou un ensemble de produits. Les applications servant la gestion du contenu dentreprise permettent de grer linformation ds le dbut et jusqu la phase de distribution, mais rien nest prvu pour un document qui doit tre retir du stockage en ligne ou du stockage dit de proximit (near-line). Trs probablement, les produits disponibles ne retrouveront pas la trace dun document stock hors ligne. La plupart des applications de gestion de contenu et de gestion documentaire ne remontent pas la piste dun document jusquau disque ou la cassette, et elles sont de toute faon impuissantes dtruire le document lectronique. Toutes celles, nombreuses, mme de reprer une rtention de document ne le peuvent que dans la mesure o la rtention correspond une simple priode de temps. Les suppressions quelles permettent deffectuer ne se font quen ligne, dans

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 38/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

lenvironnement du disque magntique ; elles suppriment simplement le pointeur, et le document lui-mme continue dexister jusqu ce quil soit dfinitivement cras. Les applications destines la gestion documentaire se rsument en ralit des ensembles de rgles professionnelles appliques un contenu particulier ou des dpts de documents. Grce elles il est certes possible de reprer la rtention dun document, quand bien mme il nest pas en ligne. Les seuls documents quelles ne peuvent pas dtruire pour de bon en crasant le pointeur sous des caractres illisibles au lieu de simplement leffacer sont justement ceux placs dans lenvironnement en ligne du disque magntique. Ces problmes ont des causes multiples. Lune des plus pernicieuses tient linculture des technologies de linformation en ce qui concerne les documents, par opposition aux bases de donnes. Prenez nimporte quel manuel sur lanalyse et la conception des systmes, et feuilletez la partie consacre lanalyse du processus mtier ou la production. Cest en vain que vous y chercherez le mot document. Je le sais parce que jenseigne cette matire et quon me paye pour relire les manuels. Ce manque de savoir sur les documents encourage le dveloppement de cultures dentreprise dont les services informatiques imaginent que lon peut tout faire avec des bases de donnes y compris dans des secteurs comme celui des assurances o les documents font pourtant lobjet de consignes gouvernementales. Il faut aussi parler des problmes de vocabulaire. Vous connaissez ceux que pose la fabrication des logiciels quant au contenu, aux documents et aux dossiers. On les retrouve jusque chez les archivistes et les responsables des services documentaires. Les archivistes amricains, par exemple, dfinissent le terme authentique sans songer leurs pairs responsables de la gestion documentaire aux tats-Unis, obligs, quant eux, de se rfrer aux lois sur la dcouverte et la production de documents, et qui prtent ladjectif authentique un sens trs diffrent et plus restrictif. De mme, pour les archivistes, les documents sont des preuves attestant une transaction commerciale , ce qui, l encore, ne tient pas compte des besoins des spcialistes de la gestion documentaire, tenus de se rfrer la loi de la preuve du droit tats-unien et canadien, o non seulement le mot preuve a un sens trs diffrent et plus restrictif, mais o, de plus, les mots transaction et commerce sont couramment utiliss pour dsigner des activits et des documents bien prcis. Peut-tre navez-vous jamais vraiment rflchi la prolifration des dpts darchives dans les entreprises, quelles quelles soient. Rcemment, jai eu loccasion de me rendre dans une compagnie internationale dassurances, o la directrice de la scurit ma remis une copie des rgles de scurit de cette entreprise. Elle sest servie pour ce faire dune cl USB. Comme je lui demandais sil existait des mesures relatives lutilisation de ces cls, elle ma rpondu que non. Le premier conseil que je donne aux responsables de la gestion documentaire en entreprise qui

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 39/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

souhaitent effectuer linventaire de leurs documents est de commencer par inventorier lensemble de leurs dpts et de mettre jour leurs rapports, leur degr de confidentialit, de scurit, et leur rle au sein de lentreprise. Lincommensurabilit des dpts lectroniques fait partie de ces choses que nous sommes amens dcouvrir. Les messages instantans ne peuvent pas tre stocks dans le dpt contenu et les textos ne sont mme pas conservs au sein de lentreprise. Nous nous sommes galement aperus que les documents lectroniques ont un caractre confidentiel, contrairement aux documents papier, sauf si ces derniers ont t imprims par lutilisateur. Lexistence dun dpt des exemplaires sur papier complique encore le problme. La responsable de la gestion documentaire, seule personne de lentreprise comprendre le cycle de vie des documents, se voit relgue ladministration des documents papier. Les dpts lectroniques chappent tout contrle. La technologie nous a persuads que nous grions les documents. En ralit, elle a surtout rendu cette gestion bien difficile. Toute la technologie de linformation ncessaire en la matire se rsume des branchements et des raccordements soigneusement effectus et une bonne photocopieuse. Nous avons surtout besoin de clairement organiser la faon dont nous concevons ce quil nous incombe de grer. Le terme archives (records) ne semploie plus que pour les documents papier ou pour des catalogues aussi rares que raffins de documents rpondant des exigences connues des seuls archivistes. Toute information conserve dans une entreprise est susceptible de lui attirer des ennuis, quelle se trouve dans la tte dun employ, dans une base de donnes ou dans un document. Elle nest pas ncessairement cantonne un processus mtier, la seule version dfinitive ou officielle dun document. Les dcouvertes amenes par les procs jugs aux tats-Unis ont fait des courriels, pourtant fort peu accessibles, les documents que redoutent le plus les conseillers fiscaux. Les craintes quils inspirent tiennent moins labsence dune gestion technologique du cycle de vie qu la manire dont le courrier lectronique est utilis. Les gens disent tout et le reste, dans ces courriers quils dispatchent en multiples exemplaires dans lentreprise. La gestion est une pratique, pas une technologie. Pour bien grer le cycle de vie des documents, la premire chose faire est de miser, non sur la technologie, mais sur la gestion.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 40/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Partie 2 - Imprim, visuel, numrique : interactions et harmonisation

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 41/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

N sur papier, lev numrique : la vie prcaire des documents issus de la production cinmatographique
James M. TURNER Professeur cole de bibliothconomie et des sciences de linformation Universit de Montral

La production de films consiste en une srie de processus trs complexes, impliquant un grand nombre dintervenants et dtapes. chaque tape, de la nouvelle documentation est cre, ou encore de la documentation existante est modifie. En cours de route et la fin de la chane, il y a des artefacts documentaires rpertorier, cataloguer, modifier, indexer et prserver. Dans la prsente communication, nous exposons quelques rsultats gnraux obtenus lors dun projet de recherche ayant rapport larchivage dlments visuels (mais non aux lments sonores) dun film danimation. InterPARES (2004) est un projet de recherche international sur les documents numriques. Le deuxime volet, dbut en 2002, sintresse aux documents interactifs, dynamiques, exprientiels, sensoriels et de performances. Les chercheurs proviennent dune vingtaine de pays et lquipe canadienne consiste en environ vingt-cinq chercheurs. Les chercheurs dInterPARES2 sont organiss en groupes de travail appartenant trois domaines :
cration et entretien de documents ; la nature des documents : authenticit, exactitude et fiabilit ; mthodes dvaluation et de prservation.

Et trois concentrations :
activits artistiques ; activits scientifiques ; activits gouvernementales.

Lorganisation dInterPARES2 prvoit aussi trois groupes trans-domaines, sur :


la terminologie ; les politiques ; la description.

Les travaux rapports dans la prsente communication sont du groupe de travail 3.1, concern par les mthodes dvaluation et de prservation dactivits artistiques. InterPARES2 nest concern que par des documents numriques.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 42/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Dans le cadre dInterPARES2, ltude de cas est la mthode privilgie pour mener bien les travaux de recherche. Le groupe de travail 3.1 a entrepris, entre autres, une tude sur le cyberthtre, sur les pratiques des musiciens crateurs de musique lectronique, et sur limage en mouvement (ce quon appelle en France limage anime). Nous exposons dans ce papier les travaux de lquipe qui sest forme pour entreprendre une tude de cas sur limage en mouvement. Les membres de lquipe sont des chercheurs universitaires et des archivistes. Dans ce papier, nous faisons le rapport des rsultats gnraux de notre tude.

Mthodologie Conformment aux mthodes de travail du projet InterPARES, nous avons commenc par former une petite quipe qui proposait comme projet dtudier les processus de prproduction, de production et de postproduction de films, afin de modliser ces processus et didentifier la documentation produite en cours de route. Ds le dbut, il y avait beaucoup dintrt pour ce projet et lquipe sest agrandie rapidement six personnes. La proposition initiale approuve par lquipe internationale tait de modliser les processus de production de films commerciaux. Cette ide est base sur la notion que la production commerciale offrirait le modle le plus gnral et le plus complet, partir duquel il serait possible de gnrer dautres modles, par exemple pour la production de films artistiques ou documentaires. Nous avons form un partenariat avec un studio de production commerciale de films numriques, lequel exigeait de garder lanonymat. Pour les fins de ltude actuelle, nous avons tudi le cas dun dessin anim. Avec le temps, notre tude de cas a pris de lexpansion. Nous avons obtenu la collaboration de lOffice national du film du Canada, producteur public et de Altair 4 Multimedia, producteur indpendant italien de multimdia. Plus tard encore, le producteur public de tlvision WGBH Boston sest joint nous, ainsi quun nouveau membre de notre quipe, laquelle comprend maintenant sept personnes. Ainsi nous avons pu tudier la production dimages en mouvement dans des contextes commercial, public et indpendant. Dans ce papier, on ne prsente que les rsultats obtenus du studio commercial, ce qui reprsente quand mme lensemble de donnes le plus complet que nous avons en main. Conformment aux mthodes de recherche approuves par InterPARES2, nous avons obtenu un certificat dthique de luniversit responsable pour le projet ainsi que les signatures des participants, sources dinformation sur les formulaires de consentement de participation ltude. Dans le cadre de toutes les tudes de cas dInterPARES2, les chercheurs sont tenus rpondre vingt-trois questions (annexe 1), lesquelles ont t formules suite de longues discussions et dun commun accord. Le but de cette approche est de permettre la comparaison entre

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 43/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

tudes de cas, afin de permettre de dresser un portrait global, dans la mesure du possible, de la situation des documents caractre culturel et artistique qui sont ns numriques . Ainsi, notre quipe a prpar quelques gabarits pour la collecte de donnes. Pour chaque document cr dans le cadre de la production de films, nous cherchions complter un formulaire (annexe 2). Ce dernier nous permettrait de comparer les structures de ces documents, les logiciels utiliss pour leur cration, la raison de leur cration, ce quon fait avec les diverses versions, et ainsi de suite. Pour effectuer la collecte de donnes, nous avons interview les personnes concernes dans les institutions choisies et lors de rencontres de notre groupe de travail avec eux, nous avons complt notre questionnaire des 23 questions. Par la suite, partir de notes rdiges lors de ces rencontres, nous avons formalis nos rponses selon les prescriptions dInterPARES2 afin de les soumettre aux membres de lquipe pour commentaires et rvisions. Ces derniers taient alors incorpors et les membres de lquipe ont pu approuver ensemble nos rponses avant de les soumettre aux membres de la grande quipe de recherche. Notre tude se limite aux activits ayant un rapport avec les aspects visuels du film, soit le dveloppement visuel, le design de personnages, et le design daccessoires. Les processus sonores et de montage ne sont pas tudis dans le prsent contexte.

Rsultats Dans cette section, nous offrons un portrait gnral des mthodes de traitement de fichiers numriques issus de la production que nous avons tudie. Nous nessayerons pas de dcrire trs prcisment les mthodes employes dans le studio commercial qui tait notre partenaire. Les donnes prsentes ici offrent une synthse des rponses que nous avons obtenues aux vingt-trois questions. titre de comparaison, nous pouvons noter que selon nos observations dans dautres environnements de production et selon des donnes informelles accumules lors de beaucoup de discussions avec des archivistes du milieu, le peu de rigueur des mthodes du studio que nous avons tudi dans le cadre du prsent projet est assez typique. Le secteur priv ne veut pas investir dans larchivage systmatique de linformation quil cre moins quil y ait une rcompense montaire la fois vidente et immdiate. Bien que le projet InterPARES2 ne soit concern que par linformation numrique, nous avons constat assez tt dans le processus de collecte de donnes que mme dans des studios de production dite entirement numrique, une bonne partie de la documentation nest pas ne numrique. Normalement, il y a beaucoup dactivit impliquant les fichiers numriques mais ces derniers ne sont considrs que comme des objets temporaires qui nexistent que pour avancer la

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 44/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

production jusqu la prochaine tape. Tout le travail a comme finalit la production dimages finales en format TIFF, prtes pour lassemblage dans le film. Dans le cas de la production que nous avons tudi, laquelle est typique des dessins anims produits par ce studio, peu de matriel numrique est archiv. Plus prcisment, chaque tape, la version prcdente est stocke dans le systme, pour le cas o ce soit ncessaire dy retourner, mais sa dure de vie est relativement courte. la fin de la production, le systme entier est inscrit sur rubans mais rien nest catalogu ni index et en pratique si le besoin se prsente pour une image provenant du film, par exemple pour des fins de cration de marchandises, on cre de nouveau limage plutt que dessayer de la trouver dans le systme. Telle est lconomie de cette industrie. Lors des tapes prliminaires de cration et de production, au moment o beaucoup dides circulent mais que rien nest fix, des dcideurs doivent visionner un trs grand nombre dimages prliminaires afin darriver approuver le projet et la forme quil prendra. Or, la technologie numrique est srieusement dficiente pour ces fins. Pour le dessinateur, aucune technologie na encore la simplicit du papier et du crayon pour exprimer rapidement et efficacement une ide visuelle, pour dmontrer la progression dune histoire, pour expliquer les tapes dans une srie de dessins. Monts sur un tableau et visionns dans leur ensemble par plusieurs personnes la fois, ces dessins offrent un portrait global facile balayer et qui remplace la manipulation boiteuse de multiples fentres sur un cran dordinateur et le traitement cognitif qui laccompagne. Pour les dcideurs qui doivent visionner les dessins, une telle vue densemble nest pas encore possible sur un cran dordinateur, mme un grand cran. Aucun dcideur naccepte de sacrifier, au nom de la technologie numrique, la vitesse de visionnement ni la possibilit de balayer un grand nombre dimages presque simultanment. Par consquent, lindustrie du cinma attendra larrive des technologies aussi performantes que le papier avant que la production ne devienne compltement numrique. En fait, mme des amliorations considrables de la technologie ne suffiront peut-tre pas. Les crateurs aiment bien dessiner sur papier sur le coin de la table la maison, assis sous un arbre avec un cahier, au restaurant ou ailleurs, l ou ils se trouvent lorsquune ide se prsente. Suite lapprobation du projet par les instances appropries dans chaque institution et lorsque le feu vert est donn pour commencer la production, les lments deviennent rapidement numriques et le demeurent, sauf exception, jusqu la fin de la production. On parle darchivage mais il faut souligner que ds le dpart trs peu de choses dans le processus ressemble lactivit telle que nous la connaissons. Larchivage dans ce milieu est vraiment atypique par rapport aux documents administratifs auxquels les archivistes sont habitus, bien quassez typique de lenvironnement de production commercial de films. Aucun programme de gestion de la documentation nest en place.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 45/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Pourtant, il faut fonctionner, il faut russir se retrouver dans tous ces objets numriques si on peut esprer complter le film. Ce qui permet de se retrouver cest les conventions tablies pour les noms des fichiers dimages artistiques appartenant la production. Lors des tapes prliminaires de production, on tablit par consensus des conventions pour lidentification des fichiers appartenant la production. Typiquement, la formule peut tre quelque chose comme ceci :
studio de production ; titre de travail de la production ; numro de la squence ; numro du plan ; identificateur de lobjet ; version de lobjet/extension du fichier.

On identifie le studio de production parce que parfois on sous-contracte le travail dautres studios. Ainsi dans cette partie de lencodage on peut identifier le propritaire de lobjet. Le titre de travail nest pas ncessairement le nom que portera le film lorsquil est mis en march, mais cest le nom temporaire convenu pour parler du film lors de sa production. Un film cest une srie de squences et celles-ci sont numrotes. lintrieur de chaque squence il y a une srie de plans, numrots galement. Plusieurs lments numriques peuvent tre composants dun plan et chacun est identifi dans cette partie de lencodage. La version de lobjet numrique reflte son tat. En cours de production, les images sont traites par de multiples intervenants, qui travaillent sur la couleur, le mouvement, lclairage, les interactions, et ainsi de suite. chaque tape de traitement, le fichier de lobjet numrique acquiert le numro de la version suivante. Finalement, lextension sert identifier le logiciel ncessaire pour ouvrir et traiter le fichier. Selon larchiviste du studio, on a mis trs longtemps comprendre limportance demployer des conventions communes pour grer les objets numriques appartenant une production. Mme maintenant, on narrive pas tablir un ensemble uniforme de conventions pour toutes les productions. Les crateurs tous les niveaux et les dcideurs dans lindustrie rsistent toute tentative de les restreindre. Ainsi, le principe dadopter un ensemble de conventions pour les noms des fichiers est maintenant compris mais les conventions ne sont pas les mmes dune production lautre. Il faut maintenir la libert dexpression ! Concernant la documentation des procdures, la situation est encore une fois assez particulire. Il ny a pas de manuel de procdures. Lors du commencement dune nouvelle production, les employs puisent dans leur exprience antrieure pour dcider comment ils vont travailler. La formation se limite linculcation de limportance de respecter les conventions

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 46/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

tablies pour chaque production pour les noms des fichiers numriques. Cest une sorte de tradition orale qui sert de documentation. moins dune demande spciale de le faire, rien nest archiv systmatiquement sauf la version finale des images et ce que larchiviste peut slectionner en cours de route. La sauvegarde des fichiers a rapport des scnarios de catastrophe et non pas la gestion de documents. Le peu darchivage effectu des lments de production a rapport aux contraintes lgales et lutilisation potentielle dans des activits de marketing. Le studio doit tre capable de prouver quil est propritaire des images afin de pouvoir poursuivre ses comptiteurs ou toute personne qui saccapare, pour des fins commerciales, son matriel. Les activits de marketing peuvent inclure la production daffiches, de publicit, dobjets de marchandise, de clips publicitaires. Sinon, les objets numriques sont considrs comme phmres, comme des tapes de la production dont lutilit est dj puise lorsque lobjet passe ltape suivante. Ainsi larchivage est loin dtre systmatique et nest effectu que lorsquil y a une raison prcise de le faire. Finalement, en rponse la question 5a sur la nature du systme, notre intervenant a rpondu que larchitecture informatique et mme le matriel informatique sont sujets des changements frquents. Par exemple, si un nouvel employ offre des arguments assez convaincants pour lacquisition dun nouveau systme, le systme informatique est chang sans autre formalit et sans ltude des besoins globaux.

Discussion Dans le studio dont nous avons tudi les mthodes de travail, le peu de rigueur et de structure que nous trouvons dans le contrle de la documentation ncessaire la production de films se trouve dans les conventions pour les noms des fichiers des objets numriques. Les crateurs acceptent de les suivre parce quils comprennent la ncessit de partager des mthodes communes afin de pouvoir retrouver au bout de la chane les morceaux ncessaires pour assembler le film. Nous observons que ces pratiques sont typiques de lindustrie commerciale gnralement. Sa nature est telle que tout peut changer tout moment. Comme nous lavons constat, il ny a pas de vision globale de la gestion de la documentation. Nanmoins, larchiviste a russi implanter quelques normes dans la gestion de la documentation qui est archive. Celles-ci comprennent le Dublin Core, les Categories for the Description of Works of Art, le Thesaurus for Graphic Materials et les Anglo-American Cataloguing Rules. De plus, il y a des fichiers dautorit et des rgles pour la population de certains champs des bases de donnes construites par larchiviste. Cependant, il faut avoir recours la persuasion et insister sur beaucoup dexplications puisque larchiviste na pas lautorit ncessaire pour exiger le respect de ces normes.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 47/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

La prservation long terme nintresse pas le studio car on ny voit aucun intrt. Comme la dj not Besser (2001), cest seulement lorsquun studio se rend compte quil y a de largent faire avec le matriel archiv, comme par exemple dans la production de sous-produits ou dinclusion de matriel supplmentaire sur les DVD, quil trouve suffisamment de motivation pour implanter un systme de gestion darchives. La culture de lindustrie est telle que tant quil ny a pas un problme prcis et immdiat rsoudre, il ny a pas de raison de sy adresser. La rponse la question 21 sur les obligations lgales, morales et thiques est rvlatrice. Notre intervenant a rpondu que les obligations lgales ont rapport la rdaction de contrats, de reconnaissance de contributions dans le gnrique du film, et le respect de contrats avec des syndicats. Comme cest le cas avec les studios commerciaux en gnral, il ny a tout simplement pas dobligations ni de questions morales. On ne soccupe que des obligations lgales.

Conclusion La nature de lindustrie cinmatographique commerciale est telle que les questions de la gestion, larchivage et la prservation long terme de documents produits comme artefacts de la production de films ne reoivent que peu dattention de la part des dcideurs. Cest larchiviste dinsister sur certains principes et sur la ncessit dadopter certaines pratiques. Cependant, il ny a que des arguments dordre montaire qui peuvent tre convaincants. Il faut dmontrer quil y aura des pertes dargent si on nadhre pas certaines pratiques. Rien dautre ne peut attirer lattention des interlocuteurs dcideurs. Cest une situation qui est quand mme assez typique du milieu daffaires et du secteur priv en gnral, quoiquun peu extrme dans le milieu cinmatographique. Larchiviste doit offrir des arguments chiffrs pour dmontrer la ncessit darchiver, dentretenir de bonnes pratiques de gestion de la documentation. Sans cet aspect, aucun argument, aucune dmonstration, aucun raisonnement ne sera considr. Il reste que peu peu, et pour des considrations montaires, les compagnies de production commencent trouver des raisons pour mieux ordonner leur documentation. Avec le temps et avec beaucoup de travail de la part des professionnels de linformation, on peut esprer voir dans ce milieu limplantation de pratiques saines de gestion de linformation produite lors des processus de production de films.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 48/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Bibliographie
BESSER, H., Digital preservation of moving image material? , The Moving Image: the journal of the Association of Moving Image Archivists 1, n 2 (fall), 2001. InterPARES, 2004. Disponible au <http://www.interpares.org> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 49/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Annexe 1 Source : <http://www.interpares.org/ip2/ip2_23_questions.cfm> [fvrier 2007]. Twenty-three questions (that Co-investigators have to be able to answer at the completion of their investigation) 1. 2. study? 3. 4. For what purpose(s) are the digital entities you have examined created? What form do these digital entities take? (e.g. e-mail, CAD, database)
a. b. c. d. e. f. What are the key formal elements, attributes, and behaviour (if any) of What are the digital components of which they consist and their What is the relationship between the intellectual aspects and the technical How are the digital entities identified (e.g., is there a [persistent] unique In the organization of the digital entities, what kind of aggregation levels What determines the way in which the digital entities are organized? the digital entities? specifications? components? identifier)? exist, if any?

What activities of the creator have you investigated? Which of these activities generate the digital entities that are the objects of your case

5.

How are those digital entities created?


a. b. What is the nature of the system(s) with which they are created? (e.g. Does the system manage the complete range of digital entities created in functionality, software, hardware, peripherals etc.) the identified activity or activities for the organization (or part of it) in which they operate?

6. result?

From what precise process(es) or procedure(s), or part thereof, do the digital entities

7. To what other digital or non-digital entities are they connected in either a conceptual or a technical way? Is such connection documented or captured? 8. What are the documentary and technological processes or procedures that the creator follows to identify, retrieve, and access the digital entities? 9. Are those processes and procedures documented? How? In what form?

10. What measures does the creator take to ensure the quality, reliability and authenticity of the digital entities and their documentation?

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 50/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

11. why? 12. 13.

Does the creator think that the authenticity of his digital entities is assured, and if so, How does the creator use the digital entities under examination? How are changes to the digital entities made and recorded?

14. Do external users have access to the digital entities in question? If so, how, and what kind of uses do they make of the entities? 15. Are there specific job competencies (or responsibilities) with respect to the creation, maintenance, and/or use of the digital entities? If yes, what are they? 16. Are the access rights (to objects and/or systems) connected to the job competence of the responsible person? If yes, what are they? 17. why? 18. Does the creator keep the digital entities that are currently being examined? That is, are these digital entities part of a record keeping system? If so, what are its features?
a. b. Do the recordkeeping system(s) (or processes) routinely capture all From what applications do the recordkeeping system(s) inherit or capture digital entities within the scope of the activity it covers? the digital entities and the related metadata (e.g. e-mail, tracking systems, workflow systems, office systems, databases, etc.)? c. d. e. Are the digital entities organized in a way that reflects the creation Does the recordkeeping system provide ready access to all relevant Does the recordkeeping system document all actions/transactions that processes? What is the schema, if any, for organising the digital entities? digital entities and related metadata? take place in the system re: the digital entities? If so, what are the metadata captured?

Among its digital entities, which ones does the creator consider to be records and

19.

How does the creator maintain its digital entities through technological change?
a. b. What preservation strategies and/or methods are implemented and how? Are these strategies or methods determined by the type of digital entities

(in a technical sense) or by other criteria? If the latter, what criteria?

20. To what extent do policies, procedures, and standards currently control records creation, maintenance, preservation and use in the context of the creators activity? Do these policies, procedures, and standards need to be modified or augmented? 21. What legal, moral (e.g. control over artistic expression) or ethical obligations, concerns or issues exist regarding the creation, maintenance, preservation and use of the records in the context of the creators activity? 22. What descriptive or other metadata schema or standards are currently being used in the creation, maintenance, use and preservation of the recordkeeping system or environment being studied?

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 51/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

23. What is the source of these descriptive or other metadata schema or standards (institutional convention, professional body, international standard, individual practice, etc.)?

Annexe 2 Les questions pour chaque document cr : 1 2 3 4 5 6 7 8 9 10 11 UID (unique identifier, which production, which department, which sequence, scene) Creator (name of the person or position) Reason created, how used Structure of the info: e.g. no structure, chronological, name & address, Medium (e.g. Word document, Photoshop file, VHS, charcoal drawing) Versioning (how do they track it, e.g. what is the path for scripts) Brief description (keywords) Date created or modified Retention schedule, backups Where in the production pipeline this piece fits Notes (any other information worth recording)

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 52/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Impact du numrique sur le cycle de vie dun document dappui rdactionnel : le conducteur du Journal Tlvis de TF1, France Analyse archivistique
Clarisse HOLIK
Rsum : En 1987, TF1 la premire chane de tlvision franaise passe du statut de chane publique celui de chane privatise. Au cours des quinze annes qui suivent, la naissance de la tlvision numrique, lvolution des mthodes de gestion et lapplication de la loi de 1992 sur le dpt lgal de la radiotlvision ont chang les procdures et mthodes de travail des archivistes et des hommes de tlvision. Un document en particulier, le conducteur du Journal Tlvis, voit son cycle de vie modifi par lintroduction du numrique. Linstantanit qui rgne en matre la tlvision, jointe un stockage phmre sur un support non tangible, ne va-t-elle pas contribuer rendre inaccessibles les archives, et ainsi effacer de la mmoire de lentreprise les traces de son activit ? Cela aurait peut-tre pu se passer ainsi mais le lgislateur franais veillait. La loi de 1992 sur le dpt lgal de laudiovisuel, applique ds 1995, en obligeant le diffuseur verser un dpartement de lInstitut National de lAudiovisuel, lInathque de France, non seulement ce qui tait diffus lantenne mais galement les documents daccompagnement, a contribu rendre ces archives accessibles aux chercheurs.

Quest ce quun conducteur ? La construction dun outil privilgi de la diffusion de linformation, le Journal Tlvis, ncessite la ralisation de nombreux documents qui servent dappui rdactionnel. Parmi eux : le conducteur du Journal Tlvis. Ce document, qui rpertorie par ordre chronologique les sujets composant le journal est plus quun sommaire. Outre larchitecture du Journal Tlvis, il indique, pour chaque vnement, lorigine du sujet, le support de diffusion, le nom des ralisateurs, reporters, les supports physiques sur lesquels sont situs les reportages, le minutage (time code) qui donne la seconde prs les

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 53/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

moments de dpart des vnements diffuser. Il montre la hirarchie de linformation et structure un flux.

Exemple de conducteur (fac simil)

Mardi 17/10/1995 dition 13 h 00 Page 1 Prsentateur : P Resp. Fabric. : D Ass. Ralisa. : T


# 1 2 3 4 5 BETA TITRE GENERIQUE DEBUT IMAGES G. ATENTAT FACTU. ATTENTAT ENQUETE (+ Debre) Plat. BARETTI SUP BETA BETA BETA BETA DIR

Rdact. Chef : B Script : L Chef Produc. : G


SON JRN SOURCE DUR 00 h 00 00 h 00 00 h 00 00 h 00 00 h 00 02 h 30 00 h 00 01 h 58 00 h 00 01 h 30

Chef dition : M Ralisateur : J Trafic Video : L


REB 40 : 2 40 : 2 40 : 2 40 : 2 40 : 2 40 : 2 37 : 5 37 : 5 35 : 5 35 : 5 P Vi

M02 M10 M12

OFF CPT CPT

P P A P B P B

TF1 TF1 TF1 STUD 1

Le cycle de vie du conducteur

Naissance

Le conducteur du Journal Tlvis est labor au cours de la confrence de rdaction pendant laquelle les journalistes choisissent les vnements traiter et lordre de passage des reportages. Dabord crit la main dans les annes 1960, le conducteur sera ensuite tap la machine (vers les annes 1970) puis sur traitement de texte (fin des annes 1980) et diffus en de multiples exemplaires ; tableau de bord des tapes de la fabrication du Journal Tlvis, il est toujours en volution, pouvant tre modifi jusqu la dernire minute soit par lactualit, soit par ltat de la technique. Lheure exacte de tirage de chaque version est soigneusement note. Il natteint sa forme dfinitive que lors de la diffusion du Journal Tlvis.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 54/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Indexation

Dun point de vue documentaire, il faut savoir que le titre des sujets nest pas issu dune liste prdfinie de mots-cls mais de lusage courant du vocabulaire dune salle de rdaction, de mme que les rubriques de lactualit suivent celles des grands quotidiens de la presse crite. Il peut tre ensuite lobjet dannotations, commentaires, caricatures, dessins divers et servir de messagerie entre deux quipes (ceci tant surtout valable pour la chane dinformation en continu LCI, ne en 1994).
Archivage

Dun point de vue archivistique, le conducteur constitue ds sa cration, comme le dit la loi du 3 janvier 1979 sur les archives, une archive vivante, aux multiples versions ; il devient archive intermdiaire ( records dans le monde anglo-saxon) ds la fin de la diffusion du Journal Tlvis. En 1991, il ny a pas, TF1, pour les archives crites, de politique darchivage bien dfinie : TF1 socit privatise gre les archives de TF1, service public et de fait, toutes les archives dorigine publique ou dorigine prive reoivent un traitement gal. Mais quen est-il pour le conducteur ? Aprs le Journal Tlvis, un exemplaire dune des dernires versions revient aux documentalistes de la vidothque qui indexent laprs-midi ou le lendemain les sujets du Journal Tlvis diffus prcdemment ; dautres exemplaires restent dans les services et sont occasionnellement consults par les journalistes, assistants ou documentalistes puis loccasion dun dmnagement, seront verss au service des Archives qui le conserveront dfinitivement. De fait, tous les services de la Direction Technique et certaines assistantes de la Direction de linformation archivent, de manire anarchique, les conducteurs. Ainsi, le service Archives peut conserver jusqu, parfois, cinq exemplaires du mme document.
Communication

Si le sort final de conducteur est dtre conserv dfinitivement, il ne va pour autant rester en sommeil. En effet, les journalistes ont besoin de connatre la hirarchie de linformation : quelle place avait, il y a cinq ans, telle nouvelle au journal de 13 heures ? Quest-ce qui, ce soir-l, a fait la une du journal de 20 heures ? Seul, le conducteur donne exactement cette information. Par ailleurs, quelques chercheurs et historiens commencent sintresser lhistoire de la tlvision et le conducteur devient l aussi une source apprcie dinformation.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 55/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

ce titre, il peut tre communiqu aux chercheurs, aprs autorisation du vice-prsident de la chane. En effet, les chercheurs publient et vhiculent de cette manire une image positive de lentreprise. Pour mmoire, les conducteurs ont t consults par, entre autres chercheurs, un sociologue faisant une thse sur le JT, machine dcrire, sociologie du travail des reporters la tlvision , par une historienne crivant son mmoire de matrise sur la composition du Journal Tlvis et par un historien allemand comparant les missions satiriques de la tlvision allemande et celles de la tlvision franaise. Ainsi les archives participent limage de marque de la chane.

Lintroduction dune informatique de tlvision ou le passage de lanalogique au numrique Les annes 1990 marquent le dbut de la convergence entre laudiovisuel (le broadcast), les tlcommunications et linformatique : le processus audiovisuel va vers le tout numrique. De 1987 2001, nous assistons la mise en place progressive dune informatique de gestion de lentreprise puis dune informatisation des processus de la chane de fabrication de linformation qui sappellera le process news . Le conducteur sera la premire application tre informatise dans un cadre plus gnral dautomatisation de la station de travail de la rdaction STAR, sous un systme dexploitation OS2 ; lapplication a pour nom GESSICA et elle fonctionne en rseau. La numrisation permet de disposer dun outil adapt au mode de travail temporel induit par lactualit. Comme lont soulign les organisateurs du congrs, le conducteur devient une sorte de phnix renaissant et toujours exact. Il est fiable puisquil est le reflet exact de ce qui se passe. Il est disponible pour tous (cest--dire pour tous ceux qui ont accs lapplication) au cours de la fabrication du JT, dynamique et modifiable jusquau moment de la diffusion non plus du JT mais du reportage. Lunit nest plus le document mais la squence : plateau, reportage Au bout de la ligne dvolue chaque reportage, un carr rouge passe au vert ds que le sujet est mont, prt tre diffus. Le tableau de bord devient dynamique. Il ressemble une mosaque fluide. Un tirage papier est fait pour les cadreurs, les assistants du plateau, le ralisateur, la rgie et pour les documentalistes de la vidothque. En 1999, la direction informatique change le systme dexploitation : on passe de lOS/2 NT et de GESSICA NAOS. Le conducteur des annes 1992 1996 est conserv sous sa forme numrique, mais les informaticiens, surchargs de travail, nont pas le temps de rintroduire le module de consultation pour les donnes de 1992 1996.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 56/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Or, cette mme anne, une tudiante en matrise dhistoire contemporaine demande consulter les conducteurs sur plusieurs annes. Son sujet traite de linfluence du Journal Tlvis sur la socit franaise. Sa demande pose, au service des Archives, un problme dordre technique : o sont les conducteurs de 1997 ? Aprs une enqute auprs des assistants, des secrtaires et des techniciens, le service Archives interroge les informaticiens qui rassurent chercheur et archiviste : Il suffit dinterroger GESSICA. Mais comment faire une recherche rtrospective ? Il faut demander Christophe, le seul informaticien qui sache interroger les donnes de 1992 1996. Or, Christophe est en vacances Finalement, le service Archives apprend que la Vidothque, pour des raisons dindexation, conserve un tirage papier du conducteur, tirage quelle met la disposition de ltudiante. Parce que les documents ont t dmatrialiss, leur destine chappe leur crateur. Le service Archives nest plus destinataire de ces documents qui, en quelque sorte, restent enferms dans lapplication. Un autre systme de sauvegarde sest mis en place Toutefois, parce que dautres systmes de rfrencement des contenus existent (la vidothque), on ne juge pas utile de conserver au-del des exigences pratiques le document et ce quon appelle aujourdhui les mtadonnes. Parce que les logiciels informatiques voluent trs rapidement, que le cot est un facteur dterminant pour la prise de dcision et que la notion du long terme, dans une entreprise prive, nest pas la mme que dans une institution patrimoniale ou une institution de service public, on a nglig la migration des donnes anciennes. Dautre part, aucun outil de recherche nest plus ralis. Le faible taux de consultation ne le rend pas ncessaire. La valeur du conducteur numrique, pour le service Informatique, baisse avec le temps.

Perceptions de cette numrisation chez les techniciens audiovisuels Une collecte des archives orales ralise par le service Archives auprs des techniciens audiovisuels a permis de rassembler quelques impressions. Pour la plupart dentre eux, la numrisation du conducteur est un avantage : la mise jour se fait en temps rel, le conducteur est disponible pour tous. Par contre, ce qui apparat comme une dmatrialisation du support est peru

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 57/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

comme une perte de lusage des sens : perte du contact direct avec la matire, du sens du toucher, diffrences dans les perceptions auditives. Il faut rapprendre la notion despace. Enfin, au niveau du management humain, il y a eu un dplacement des critres de comptences ; certains techniciens ont eu le sentiment que ce qui devenait important dans le travail tait la bonne manipulation de loutil et non la qualit du produit fini. Lun dentre eux parle du Journal Tlvis : avant la numrisation, un bon journal tait celui o les sujets taient bons, o le journaliste ne bafouillait pas, o les plans senchanaient bien. lheure actuelle, un bon journal est celui o les machines ont bien fonctionn : il y a donc un dplacement au niveau du but du travail : il faut optimiser les outils. Dun point de vue archivistique, cette numrisation amne une rupture dans lorganisation de la collecte des archives. Nous avons vu que les services producteurs ne sont plus responsables de ce quils crent : ils ne se sentent plus propritaires et narchivent plus. Dautre part, le service Informatique fonctionne en autonomie : il archive lui-mme ses bandes magntiques. Ny aurait-il pas confusion entre sauvegarde et archivage ? Larchiviste sadapte :
dpossd dune partie de ses archives matrielles, il doit faire connatre sa spcificit : le traitement de linformation doit-il entrer dans une logique de knowledge management, cest--dire reprer les sources dinformation, les inventorier, classer les documents quils soient sous forme numrique ou sous forme papier selon leur valeur, valeur qui dterminera la longueur de la vie du document ? Na-t-il pas pour mission de permettre un accs la mmoire de lentreprise ? doit-il sinsrer dans les groupes de travail des dcideurs, mieux faire connatre son mtier aux informaticiens et mieux connatre les leurs ? doit-il faire campagne pour avoir en dpt les applications informatiques, les diffrents systmes dexploitation qui se succdent dans le temps et les appareils de lecture ? enfin, au-del de la Loi sur les Archives et la rentabilit immdiate dun service faut-il dterminer la longueur du cycle de vie dun document en fonction de sa valeur ? Mais cette valeur est-elle cre par ceux qui crent le document ou ceux qui en auront besoin plus tard ?

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 58/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Le service Archives a donc ralis un outil de reprage de linformation dans lentreprise, cest--dire un inventaire des diffrents types darchives que lon pouvait trouver dans les services, class selon les principaux types de demandes, publi dans un premier temps sur support papier et destin tre consult sur lintranet de lentreprise. Pour des raisons techniques, cette dernire tape na jamais vu le jour. Toutefois, on peut, en 2004, consulter sur Internet quinze jours de journaux tlviss de TF1. <http://www.tf1.fr>, le conducteur tant rduit sa plus simple expression. Que se passe-t-il pour les autres chanes ? La journe dtude, organise le 9 novembre 2001 par lAssociation des Archivistes dEntreprise sur les archives crites du Monde Audiovisuel, permet de constater que les chanes de tlvision, en France, ne paraissent gure proccupes par la gestion des archives institutionnelles, ni la transmission dune mmoire crite.

volution de la lgislation Paralllement, le lgislateur franais a pris conscience du besoin dtendre la loi sur le dpt lgal la radiotlvision. Vote en 1992, la loi sera applique ds 1995. Le dcret dapplication du 31 dcembre 1993 a retenu dune part les critres de nationalit franaise et de premire diffusion et dautre part, le principe dun dpt diffrenci selon le genre (stock ou flux de lmission). Il mentionne galement le versement de documents crits lis la production des missions, leur programmation, diffusion et promotion. Un exemplaire du conducteur du JT est donc vers lInathque de France avec dautres matriels audiovisuels. LInathque collecte galement tous les documents daccompagnement, cest--dire toute la documentation crite relative aux diffusions. Les avant-programmes, les conducteurs dantenne, les scripts, scnarios, conducteurs dmissions : 600 000 documents crits sont verss chaque anne au titre du dpt lgal favorisant ainsi le dveloppement de larchive comme objet de recherche, suivant ainsi la politique archivistique du Canada.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 59/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Conclusion La dmatrialisation du conducteur du JT, crant un document dynamique, modifiable en temps rel et parfaitement adapt son environnement, peut, lorsque les logiques de rentabilit immdiate et de travail en temps rel rgnent, conduire une perte dinformation. Toutefois, le lgislateur prend le relais en offrant, grce au dpt lgal, une sauvegarde et une utilisation patrimoniale de ce document.

Bibliographie
Archives institutionnelles de lINA, Cote 85, art 2, 4, 7, 9 et 14 AISSAOUI, M., Comment la rdaction de TF1 est passe au tout numrique, Le Figaro entreprises, 14 janvier 2002, p. 32-33. BOISMENU, G., BEAUDRY, G., Le Nouveau Monde numrique. Le cas des revues universitaires, Paris, La Dcouverte, 2002, 178 p. CHABIN, M. -A., Document trace et document source. La technologie numrique change-t-elle la notion de document ?, Information-Interaction-Intelligence, vol. 4, n 1, p. 141-157. CHABIN, M.-A., Exigences numriques et besoins documentaires , Solaris, n 6, dcembre 1999janvier 2000, revue consulte en fvrier 2007, <http://bibliofr.info.unicaen.fr/bnum/jelec/Solaris/d06/6chabin.html>, [collecte des archives orales ; t 2000, t 2001]
Les dossiers de laudiovisuel

Archives de la tlvision, images de notre temps , Les dossiers de laudiovisuel, n2, 1981. Radio et Tlvision : les archives crites , Les dossiers de laudiovisuel, n70, 1996. Les archives tlvisuelles lheure du numrique , Les dossiers de laudiovisuel, n93, 2000. FOX, D., Le Journal Tlvis, Montral, Llan vert, 1998. JEANNENEY, J.-N., SAUVAGE, M., Tlvision, nouvelle mmoire. Les magazines de grand reportage, Paris, Le Seuil, INA, p. 211-224. Loi n79-18 du 3 janvier 1979 sur les archives.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 60/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Dcret n79-1038 du 3 dcembre 1979 MICHEL, H., Les Grandes Dates de la tlvision franaise, Paris, PUF, coll. Que sais-je ? , 1995. MULLER, A., PIERRE, M. (TF1) : Je suis devenu un homme de la tlvision. , 2002. <http://www.01net.com/article/197622.html> [fvrier 2007]. QUEAU, P., La Plante des esprits. Pour une politique du cyberspace, Paris, Odile Jacob, 2000, 329 p., ISBN : 2-7381-0909-8. RODES, J.-M., PIEJUT, G., PLAS, E., La Mmoire de la socit de linformation, Paris, Unesco, 2003. Restaurer, disent-ils , Le technicien du film, n 154, 2001, p. 7-16. RICOEUR, P., La mmoire, lhistoire, loubli, Paris, Le Seuil, p. 210. SIRACUSA, J., Le JT, machine dcrire. Sociologie du travail des reporters la tlvision, Bruxelles, De Boeck, Wesmael Universit/Ina, coll. Mdias Recherche , 2001, 299 p.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 61/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Partie 3 - Le document sans mutations

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 62/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Le deuil de la mmoire
Anne-Marie BERTRAND cole nationale suprieure des sciences de linformation et des bibliothques

Alors que le colloque souhaite traiter la dure de vie du document et les modifications qui y sont apportes par lavnement du numrique, cette contribution a pour propos (paradoxal ?) daborder la question de la dure de vie du document papier et de ses transformations travers lexemple du Mtier de bibliothcaire, manuel publi par lAssociation des bibliothcaires franais onze reprises entre 1966 et 2003. partir de cet exemple, est interrog le statut de tmoignage que le document (la trace) a pour lhistorien et les changements que ce statut peut connatre avec le numrique. Si linstabilit du document en ligne dtruit lide mme de trace en ne gnrant que du contemporain, faut-il faire le deuil de la mmoire ? La dure de vie du document numrique peut tre considre comme un concept saugrenu, alors mme que le numrique permet (permettra) des adaptations successives, des volutions permanentes, des mises jour perptuelles qui prolongent, chaque fois, cette dure en la projetant vers lhorizon, toujours venir et toujours inaccessible. Dans son rapport Bibliothques universitaires et nouvelles technologies , Bruno Van Dooren est explicite : Il convient de rappeler que ldition numrique, la diffrence de ldition imprime, ne produit pas de document fig ; elle suppose un suivi et une actualisation permanente des publications et une maintenance des accs . Patrick Bazin renchrit : Mettre jour : voil bien le rite quotidien de toute activit numrique. Fini les ratures et les paperolles que lcrivain laissait la postrit 14 . Dans cette communication, je souhaite montrer en quoi cette mallabilit du document numrique pose question pour lhistorien. Je propose den faire lanalyse partir de lexemple du Mtier de bibliothcaire, manuel publi sous la responsabilit scientifique de lABF (Association des bibliothcaires franais).

14

Patrick Bazin, La mmoire reconfigure , Les Cahiers de mdiologie, n 11, 2001.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 63/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Le Mtier de bibliothcaire, cycle de vie Hritier des manuels du dbut du


XX
e

sicle, Le Mtier de bibliothcaire est dabord un

recueil de cours 15 qui a volu progressivement vers un ouvrage de synthse et de rflexion. Il est considr comme le manuel de base , le bagage minimum des professionnels de la lecture publique et de ceux qui aspirent le devenir il est ainsi utile la fois dans lexercice du mtier et dans la prparation aux concours de recrutement. Cest louvrage sans doute le plus connu et le plus lu de la littrature professionnelle (bibliothcaire) franaise. Il a t publi onze fois entre 1966 et 2003.
Cycle de vie ditorial

Lhistoire de cet ouvrage est marque par une csure commerciale : jusqu la 5e dition (1977), il porte le titre de Cours lmentaire de formation professionnelle et est dit dabord par la Bibliothque nationale, puis par lABF ; partir de la 6e dition (1979), il porte le nom de Le Mtier de bibliothcaire et est dit par un diteur priv (Promodis, devenu le Cercle de la Librairie). LABF, pour toutes les ditions, est lauteur de louvrage. La pagination augmente progressivement, de 167 pages pour la 1e dition 454 pages pour la 11e, signe de la complexit croissante du mtier et de lextension de son champ dactivit. Les tirages sont assez constants : 4 500 pour la 5e dition (1977), 6 000 pour la 11e dition (2003) pour le premier tirage Les onze ditions qua connues le Mtier depuis 1966 sont dabord assez harmonieusement chelonnes, un rythme environ triennal : 1966, 1969, 1971, 1974, 1977, 1979. Puis le rythme se ralentit : 1983, 1988, 1992, 1996, 2003 16 . Paradoxe, alors mme que les effectifs de la lecture publique, et donc le lectorat potentiel, augmentent rapidement : 1980 Nombre de BM Emplois 930 7 169 1983 1 106 9 590 1987 1 366 11 632 1991 1 885 13 330 1995 2 315 16 374 2000 2 886 20 460

Plusieurs lments motivent la ralisation dune nouvelle dition, animant divers titres les acteurs de cette entreprise : lauteur moral (lABF), lquipe des contributeurs et lditeur commercial.
15 16

Dans les quatre premires ditions, la table des matires sintitule Plan des cours . Les nouvelles ditions sont compltes par de nouveaux tirages, avec des textes lidentique ou trs marginalement mis jour (statistiques, adresses utiles, etc).

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 64/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Premire raison, voquer rapidement : un tirage puis. Raison importante mais non suffisante si, dans le mme temps, aucune quipe de contributeurs nest prte sinvestir. Auquel cas lditeur est bien oblig dattendre . Deuxime raison : lvolution technique, qui engendre lobsolescence des contenus. On voit que ce nest pas une raison majeure puisquau moment o les volutions techniques sacclrent (dans les annes 1990), le rythme de parution des nouvelles ditions se ralentit. Troisime raison : la volont de lauteur, lABF. En effet, ldition du Mtier nest pas seulement une entreprise ditoriale, cest aussi, dune part, un service que lABF rend la profession et aux jeunes gens qui souhaitent y entrer, et cest, dautre part, un territoire symbolique : celui de la reproduction de la profession et celui, surtout, de la diffusion de la doxa professionnelle. Occuper ce terrain ne peut tre une proccupation absente des proccupations des instances de lABF 18 . Quatrime raison, et qui semble bien la principale : la disponibilit dune quipe.
Cycle de vie dune quipe de contributeurs
17

Le Mtier est un ouvrage collectif 19 . Sous la houlette dun coordinateur, il rassemble au dpart une douzaine de collaborateurs, nombre qui saccrot dans les annes 1990 : ldition 1992 en compte dix-sept, ldition 1996 dix-huit et ldition 2003 emporte la palme avec vingt-six contributeurs et (du coup ?) deux coordinateurs. Lorigine de ces contributeurs volue au fil du temps, formant des quipes qui se renouvellent progressivement ou brutalement. Les bibliothcaires de la rgion parisienne sont les plus gros contributeurs. Ainsi, par exemple, en 1974 (4e dition), participent louvrage seize contributeurs dont neuf bibliothcaires municipaux de la banlieue parisienne, deux bibliothcaires de la Ville de Paris, deux bibliothcaires de comits dentreprise et pas un seul provincial ; en 1979 (6e dition), onze contributeurs participent louvrage, sous la houlette de Jacqueline Gascuel, quatre bibliothcaires de la bibliothque de Massy (bibliothque dtat, dapplication et de formation), un bibliothcaire de la Direction du livre (ministre de la Culture), un bibliothcaire de la Ville de Paris et cinq bibliothcaires municipaux de la banlieue parisienne toujours pas un seul provincial. Il faudra attendre la 10e dition (1996) pour que
La place particulire du Mtier chez son diteur est souligne par le fait que louvrage nappartient pas la collection Bibliothques . Il ne dpend pas dun directeur de collection et cette extra-territorialit implique un dialogue direct entre lABF et lditeur. 18 Dans son avant-propos la 9e dition, Franoise Danset, alors prsidente de lABF, crit : Le Mtier de bibliothcaire : un titre comme un oriflamme qui annonce tout la fois le programme dune formation professionnelle, la transmission dun savoir, la description dune fonction, laffirmation dune identit. 19 LABF est toujours prsente comme auteur la Section des bibliothques publiques figure sur la page de titre jusqu la 7e dition. Toutes les ditions, sauf celle de 1977, indiquent la liste des contributeurs. Le nom du coordinateur ne figure sur la page de titre qu partir de la 8e dition.
17

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 65/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

contribuent cette entreprise des directeurs de bibliothques municipales de province (Claudine Belayche, Danile Taesch, Hugues Vanbesien). Sur les onze contributeurs de 1979, neuf participent encore ldition suivante (1983), six celle de 1988 et les six mmes celle de 1992 ils ne sont plus que trois intervenir en 1996. La longvit la plus grande est celle de Germaine Frigot, qui inaugure sa collaboration en 1974 (4e dition) et la termine en 1996 (10e dition). Les contributeurs sont, pour la plupart, des bibliothcaires militants de lABF : mme sils sont rmunrs sous forme de droits dauteur, le travail qui leur est demand est lourd et sajoute la charge professionnelle. La constitution dune quipe est donc un pralable ncessaire la prise en charge dune nouvelle dition (alors que les rimpressions mises jour demandent, videmment, moins de travail). Runir les comptences et mobiliser les nergies disponibles nest dj pas chose facile. cela sajoutent des interfrences avec lhistoire de lABF. La composition de la deuxime quipe, partir de la 4e dition (1974), est rvlatrice du rle majeur que jouent les bibliothcaires dle-deFrance dans la prise en charge du projet on se souvient que les bibliothcaires de la banlieue rouge ont jou un rle prpondrant dans la querelle qui opposait, lABF, sectoristes et municipalistes dans les annes 1970. Par ailleurs, dans la mesure o les instances lues de lABF sont directement impliques dans ce projet, llection de nouveaux responsables peut avoir des consquences ditoriales. Peut avoir des consquences, mais pas obligatoirement : les annes 1980 et 1990 ont vu lquipe en charge du Mtier traverser sans encombre trois prsidences successives. Mais la 11e dition, elle, a moins bien navigu : la 10e dition date de 1996 ; aprs une rimpression lgrement mise jour en 1998, une nouvelle dition entirement refondue est prvue en accord avec lditeur. Les travaux prparatoires, mens en 1999 et 2000, sont interrompus la fin de la prsidence de Claudine Belayche et une nouvelle quipe est mise en place par les instances nouvellement lues. Cest cette quipe qui ralisera la 11e dition, sortie en octobre 2003, sept ans aprs la prcdente.

Le Mtier de bibliothcaire, source pour lhistoire des bibliothques Au-del de lhistoire de ce livre et de ses ditions, lanalyse des contenus est une approche extrmement productrice pour lhistorien pour apprcier, par exemple, les avances de la professionnalisation, les changements de paradigmes ou lvolution du regard port sur les missions des bibliothques. Ce qui mintresse donc dans ce manuel , cest sa place dans la construction de la culture professionnelle. Culture compose, bien sr, la fois de technique, de savoir-faire, de comptences,

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 66/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

de dispositions mais aussi dune histoire, de grands rcits, dhommes providentiels, de combats, de valeurs et dobjectifs. Janalyserai cet ouvrage ici non pas selon langle de lvolution des techniques (le mtier change car les techniques changent), mais selon celui de lvolution de la culture professionnelle et plus particulirement la question des relations avec les usagers (accueil, mdiation, frquentation, fidlisation, dmocratisation, etc.). De ce point de vue, les onze ditions du Mtier se composent de quatre priodes. Une premire priode, que je qualifierai de nave , va de la premire dition la quatrime (1974) ; une deuxime, optimiste , va de la cinquime la septime (1983) ; en 1988, souvre une priode critique non par rfrence une situation critique, mais par rfrence la sociologie critique de Pierre Bourdieu ; enfin, depuis 1996, cest une approche composite, que je qualifierai de professionnelle , qui prvaut. Ne pouvant dvelopper ici tous les aspects de la question des publics, je mettrai en vidence la faon dont cet ouvrage traite deux questions : dune part, la frquentation ; dautre part, la gratuit (ou non-gratuit) des bibliothques.
Une approche navement technique

La frquentation des bibliothques est, dans une premire phase (1e 4e dition), considre comme une affaire purement technique. Les aspects voqus concernent les modalits dinscription des lecteurs, laccueil ou la faon de communiquer avec eux.
1969 : Le bibliothcaire est lintermdiaire entre le livre et le lecteur. Lesprit mme de notre mtier est un esprit de Service, de coopration, dentraide. Pour tre un bon bibliothcaire, il faut aimer les livres mais il faut aussi sintresser aux lecteurs. Retenons dabord que la premire impression, lors de laccueil, pse lourd dans la balance. Do lobligation de montrer au nouveau lecteur un visage souriant et mme de savoir assouplir au maximum, sil est besoin, les conditions administratives prvues pour linscription. Un homme, une femme qui viennent sinscrire une bibliothque ne sont pas des dlinquants, ni mme des escrocs en puissance. 1971 : Un homme, une femme qui viennent sinscrire une bibliothque ne sont pas des dlinquants en puissance. (Idem en 1974).

Sur la question de la gratuit, mme approche purement technique :


1969 : Si vous avez un prt payant (ce que je ne souhaite personne, car les dmls avec les recettes-perceptions sont constants, certains receveurs municipaux exigent un talon de recette pour chaque encaissement : le systme encore le plus pratique est un genre de carte de mtro que lon poinonne), il faut prvoir des couleurs diffrentes pour les gens qui payent plein tarif, les tudiants, les retraits. 1971 : mme texte ainsi complt : Si on peroit un droit dinscription annuel, on le fait verser au moment de linscription, et chaque anne vous le demandez partir dune

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 67/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

date fixe (le 1er septembre par exemple) ; le systme le plus simple alors est de tamponner le millsime dans les cases prvues cet effet sur la carte ou la pochette. En 1974, la premire phrase disparat, ne reste que la seconde ( Si on peroit ). Une approche sociale

Rupture de ton partir de ldition 1977 : ici, la frquentation des bibliothques apparat comme une question sociale ou politique, et non plus comme une question technique.
1977 : Sans mconnatre le rle de conservation des documents qui incombe toutes les bibliothques et mme aux bibliothques publiques, on sest efforc depuis quelques annes de les rnover, de les ouvrir largement sur la vie, de les doter de moyens leur permettant de rpondre lattente du public. Les rsultats obtenus ont permis de dmontrer que la bibliothque tait un quipement culturel de base et de masse. Il est toutefois des obstacles au dveloppement qui ne sont pas du ressort des bibliothcaires : les statistiques indiquent en effet que :

les jeunes lisent plus que les adultes, les citadins plus que les ruraux, les couches aises plus que les catgories sociales dfavorises, les personnes qui ont un niveau scolaire lev plus que celles qui ont arrt les tudes trs tt et plus loin : Le temps nest plus aux illusions naves de ceux qui craient les bibliothques populaires pour combattre loisivet mre de tous les vices. La bibliothque apparat aujourdhui comme un quipement de base, destin au public le plus large, mais dont limpact rel demeure li tout le dveloppement socioculturel du pays.

Ldition 1979 est plus clairement politique (cest non seulement lpoque giscardienne o les budgets de la Culture sont malmens, mais lpoque prmitterrandienne, o le PS voulait changer la vie ) :
Si des moyens sont ncessaires au dveloppement dun rseau de bibliothques susceptibles de satisfaire les besoins de tous, il est bien vident quils ne suffisent pas assurer la promotion du livre. Il ne faut pas sous-estimer le poids des facteurs socioconomiques ou culturels, et leur influence sur la lecture et, dune faon plus gnrale, sur les loisirs culturels []. Ajoutons que pour avoir envie de lire, il faut certaines motivations : curiosit intellectuelle, ambition sociale ou aspiration transformer le monde, etc. : une socit sans esprance na pas besoin de livres !

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 68/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

En 1983, les conditions de travail et de vie sont ajoutes aux facteurs dfavorables la frquentation des bibliothques :
Mais les statistiques sur les pratiques culturelles ne peuvent tre dissocies de celles sur les conditions de vie : lorsque la dure hebdomadaire du travail dpasse cinquante heures, lorsque le trajet pour se rendre au travail dure une heure chaque jour, voire deux ou trois heures, la pratique de la lecture diminue (aux heures de pointe, il est difficile de lire dans les transports en commun).

Par contre, sur la question de la gratuit, on ne constate pas dapproche plus politique que dans les ditions prcdentes :
1977 : Dans les tablissements percevant un droit dinscription annuel, ce droit est encaiss lors de la premire visite et renouvelable date fixe. Toutefois, que le prt soit payant ou totalement gratuit, il demeure toujours utile de valider annuellement les anciennes inscriptions. Le systme le plus simple est celui qui consiste apposer un cachet millsim sur des cases de la carte ou de la pochette prvues cet effet. 1979 : LUnesco a recommand la gratuit totale des bibliothques. Toutefois certaines sont obliges de faire payer un droit dinscription annuel : ce droit est encaiss lors de la premire visite et renouvelable date fixe. Que le prt soit payant ou totalement gratuit, il demeure toujours utile de valider annuellement les anciennes inscriptions. [] Le texte est repris lidentique en 1983. Une approche critique

partir de 1988, une nouvelle place est donne la question des publics : en 1983, encore, cette question est traite dune part dans le chapitre introductif ( Le Livre et les bibliothques ) et dautre part dans un chapitre technique ( Inscription des lecteurs ). Dans la 8e dition, apparat un nouveau chapitre, confi Jean-Claude Utard, La Sociologie de la lecture . Une tout autre analyse y est diffuse par le Mtier : il ne sagit plus de mettre laccent sur les obstacles culturels ou socio-conomiques qui freinent le dveloppement de la frquentation des bibliothques (ge, niveau de diplmes, conditions de travail, etc.) mais de rvoquer en doute lide mme que les bibliothques pourraient attnuer, voire vaincre, ces obstacles. Les travaux de Pierre Bourdieu et Jean-Claude Passeron et les tudes sur les pratiques culturelles des Franais sont explicitement voqus par Jean-Claude Utard lappui de son propos :
1988 : Pendant longtemps on a cru que la simple ouverture de bibliothques suffirait gagner de nouveaux lecteurs, que la gratuit du livre en assurerait la dmocratisation, et quainsi viendraient progressivement la lecture des individus et des couches sociales qui auparavant ne lisaient pas. lusage, il nen est rien : 14,3 % seulement de Franais de plus de 15 ans sont inscrits en bibliothques, tous types de bibliothques publiques confondus (13,2 % en 1973), et

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 69/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

parmi ces inscrits se retrouve lingale rpartition des lecteurs. Frquentent dabord les bibliothques les habitus de la lecture : cadres suprieurs et moyens, lves et tudiants, bacheliers et diplms de lenseignement suprieur, parisiens et habitants des grandes villes sont les fidles adhrents. Petits et faibles lecteurs y sont minoritaires : 36,8 % des tudiants y taient inscrits en 1981, 27,9 % des cadres suprieurs et professions librales, mais seulement 7,8 % des manuvres et 5,9 % des non diplms. [] Les travaux de J.-C. Passeron et de ses lves dans les bibliothques de la rgion parisienne, ceux de J.-F. Barbier-Bouvet et M. Poulain la BPI, rappellent que par ses techniques doffre comme par ses contenus offerts, la bibliothque correspond surtout aux attentes et aux pratiques culturelles des classes moyennes.

Un changement aussi radical de point de vue semble ne pas avoir convaincu tous les contributeurs de cette dition. Ainsi, les propos de Jean-Claude Utard sont nuancs par Jacqueline Gascuel, alors prsidente de lABF :
Nous verrons plus loin (cf. chapitre V) que la sociologie nous apprend mesurer linfluence des facteurs socio-conomiques sur la lecture et dune faon plus gnrale sur les pratiques culturelles. Mais les tudes sur les pratiques culturelles ne sauraient tre dissocies de celles sur les conditions de vie : lorsque la dure de travail dun agriculteur dpasse cinquante heures, lorsque le trajet pour se rendre lusine ou au bureau dure une heure chaque jour, voire deux ou trois, lorsque le chmage et les rats du systme scolaire crent un sentiment dexclusion, la pratique de la lecture diminue Il est des obstacles la frquentation des bibliothques qui ne sont pas du ressort des bibliothcaires !

Ldition 1992 garde peu ou prou les mmes textes mais, peut-tre effraye par laudace de ldition 1988, attnue lgrement les propos tenus sur lchec de la dmocratisation. Jean-Claude Utard, lui-mme, se montre ainsi moins pessimiste :
[] lusage, il nen est rien : presque 17 % des Franais de plus de 15 ans sont inscrits en bibliothques en 1989, tous types de bibliothques publiques confondus (13,2 % en 1973). Dautres statistiques sont plus rconfortantes : 23 % des Franais de plus de 15 ans y auraient mis les pieds en 1989. Quant la Direction du livre, elle estime que le nombre des seuls inscrits des bibliothques municipales est pass de 2,8 millions de personnes 4,3 millions entre 1981 et 1986, soit 15,7 % de la population [etc.]. desservie. Avant denchaner sur le texte lidentique : Malheureusement, parmi ces inscrits, se retrouve lingale rpartition des lecteurs

Cest aussi dans ldition 1988 quapparat une rupture dans le traitement de la question de la gratuit : pour la premire fois, elle nest pas considre comme une simple question technique

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 70/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

(paiement des cotisations) mais aussi comme une question politique cependant, le texte ne plaide pas vigoureusement en faveur de la gratuit, mais plutt pour un usage raisonn et modr de la tarification :
1988 : LUnesco a recommand la gratuit totale des bibliothques. Cependant, un certain nombre dentre elles, la demande de leur autorit de tutelle, fait payer un droit dinscription. Dans ce dbat pour ou contre la gratuit, qui oppose souvent les dcideurs aux bibliothcaires, et mme les bibliothcaires entre eux, il est important de souligner les points suivants :

largent obtenu avec les abonnements ne peut tre quune participation modeste au budget de la bibliothque qui, mme payante, ne peut pas sautofinancer ; la gratuit pour les enfants est un principe faire admettre imprativement ; le tarif ne doit surtout pas tre trop lev car il deviendrait dissuasif et, sil est drisoire, il est sans intrt et mme dun effet ngatif sur le public comme sur le personnel, car il ne faut pas oublier que la tenue de la rgie comptable est en ellemme coteuse en temps et en nergie ().

Le mme texte est repris lidentique dans ldition 1992 et, vrai dire, le corps de doctrine expos dans cette dition est rest inchang jusqu aujourdhui.
Une approche professionnelle (1)

partir de la 10e dition (1996), on peut constater un certain retour une approche technique, sans que laspect social ou politique soit cart : ce cumul des registres peut tre considr comme une approche professionnelle , intgrant les apports des gnrations prcdentes et crant ainsi, par accumulation, une culture professionnelle assise la fois sur lhritage (les valeurs, les objectifs) et sur lexprience des nombreuses bibliothques ouvertes alors depuis une vingtaine dannes. Dans cette dition (1996), la question des publics est traite plusieurs reprises : dans la partie introductive, notamment dans un nouveau chapitre intitul Les bibliothques publiques : missions et enjeux , et dans trois autres chapitres, Les bibliothques des collectivits territoriales , Laccueil et linformation du public et La sociologie de la lecture . Signe, sans doute que le souci des usagers est devenu central et traverse donc bien des aspects de la vie des bibliothques et, partant, de cet ouvrage de formation. Lon y trouve la fois une approche dj vue dans les ditions prcdentes (la dploration de la toujours faible frquentation et le doute sur la capacit des bibliothques atteindre une relle dmocratisation de ses publics) mais aussi une approche plus sociale et, grande nouveaut de cette dition, lapparition des lus comme acteurs des choix et arbitrages du fonctionnement des tablissements.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 71/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

1996 : Ces missions des bibliothques publiques, brosses grands traits, font apparatre limportance de leur ouverture au plus grand nombre, et plus encore aujourdhui o le contexte social et conomique prsente des signes graves dexclusion sociale. Le bibliothcaire devra convaincre ses autorits de tutelle que les conditions daccs et le rglement intrieur (heures douverture les plus larges, modalits et formalits daccs rduites, gratuit totale pour la consultation des documents) sont des lments prendre en compte pour assurer une relle ouverture tous, et son corollaire laccs libre et gratuit linformation.

Curieusement, cette richesse dapproche dans la question des publics, rpondent de pauvres considrations techniques sur la question de la gratuit :
1996 : ce propos quelques remarques simposent. Dune part, la multiplication des catgories dusagers, comme, du reste, des dures de prt, rend le systme opaque pour lusager et alourdit la gestion de la bibliothque []. Dautre part, la tarification diffrencie des services est peu compatible avec le concept de mdiathque, qui suppose quun besoin documentaire peut de plus en plus tre satisfait de manire indiffrencie par le recours plusieurs supports (un imprim, un documentaire vido, une dition papier partir dun CD-Rom) []. Cest pourquoi le manifeste de lUnesco sur les bibliothques publiques et les motions de lAssociation des bibliothcaires franais affirment le principe de la gratuit. Il appartient la collectivit responsable de dfinir les conditions faites aux diffrents publics. Il appartient au bibliothcaire dinformer les dcideurs sur tous ces points, pour viter ldification dun labyrinthe administratif et tarifaire prjudiciable la fois au public et au service qui doit supporter la gestion des sommes perues et la charge des procdures dinscription. Une approche professionnelle (2)

Ldition de 2003 prsente une grande nouveaut : la question des publics est traite non seulement par les bibliothcaires mais par un sociologue, Christophe Evans : aboutissement du mouvement de professionnalisation ? Son propos est critique, mais pas plus que celui tenu par le bibliothcaire Jean-Claude Utarddans les ditions prcdentes :
2003 : Si les bibliothques, en France, sont globalement apprcies, on ne peut pas dire toutefois que leur frquentation soit proprement parler une pratique gnralise et soutenue (). Cette proximit idologique ne concide pas ncessairement avec une familiarit dusage. Pas moins de 69 % de personnes en France, ges de quinze ans et plus, dclarent ainsi ne pas avoir frquent une bibliothque, quel que soit son type, au cours de lanne.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 72/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Il ne faut donc pas confondre la saturation de certains quipements, notamment certains jours de la semaine ou certaines priodes de lanne, avec un succs gnralis au plan national ou une dmocratisation de la lecture publique au sens fort de lexpression, cest--dire un usage partag quitablement en fonction des diffrentes catgories sociales.

Le constat des limites des bibliothques est largement partag mais les remdes y apporter restent toujours trouver. Cest ainsi la complexit de la question qui est souligne. Quant la question de la gratuit, elle est, comme depuis 1992, traite sous un angle pragmatique :
2003 : Les bibliothcaires se sont souvent prononcs, par le biais de lABF notamment, pour une gratuit totale des bibliothques et de leurs services. Cependant, il faut constater de manire pragmatique que 20 % seulement des bibliothques pratiquent une inscription totalement gratuite. De plus, on constate une discrimination selon les supports, nombre de collectivits imposant une inscription titre onreux pour les supports autres que le livre : discrimination qui peut pnaliser laccs des plus dmunis au disque ou au multimdia, et qui nest plus de mise lpoque des mdiathques. Le bibliothcaire devra donc, le plus souvent, composer avec une municipalit dcide pratiquer linscription payante, souvent au seul prtexte de lide, peu vrifiable au demeurant, quune inscription symbolique rend lusager plus responsable. La responsabilit du bibliothcaire consistera conseiller ltablissement dun tarif qui prserve laccs le plus large possible, et notamment la gratuit absolue de linscription pour les jeunes, jusqu 18 ans si possible ; il prconisera des droits trs minors, voire la gratuit, pour les demandeurs demploi et certaines autres catgories dusagers : personnes handicapes, personnes ges, etc.

Cette srie dditions sachve ainsi, provisoirement, sur lexpression dune culture composite, la fois soucieuse de dmocratisation mais aussi de gestion. Lesprit de ralit se manifeste clairement, produisant trangement un effet de rapprochement avec les premires ditions de louvrage. Certes, dans la premire priode, ce que jai appel navet pouvait sexpliquer par un certain enchantement du monde ; alors que, en sens inverse, cest la conscience de lampleur dmesure de la tche (la dmocratisation) qui, aujourdhui, peut expliquer le souci pragmatique de grer au mieux les obstacles qui slvent dans un monde dsenchant. Il me semble qu lanalyse de ces textes, on peut bon droit considrer laccumulation, la sdimentation des diffrentes ditions du Mtier comme une source majeure pour lhistoire de la profession de bibliothcaire pour lhistoire de llaboration de sa culture professionnelle.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 73/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Cycle de vie, dure de vie partir de lexemple du Mtier, quelles rflexions peut-on tirer sur la question qui est pose ici aujourdhui, celle du cycle de vie, de la dure de vie du document que jai voque, au dbut de mon intervention, sous langle de la mise jour en ligne ? Reprenons la phrase emblmatique du projet de ce colloque : La numrisation, la diffusion des formats numriques originaux, les nouvelles mthodes dindexation et danalyse du document ainsi que le fonctionnement en rseau changent les donnes de base de la vie du document qui devient une sorte de phnix incessamment renaissant, ou de Prote si nous voulons rester dans le domaine mythologique. On sait combien la question de la dure de vie du document interpelle le bibliothcaire et lhistorien et ses mthodes. En quoi le document numrique, constamment mis jour, renouvel, recommenc, modifie-t-il, va-t-il modifier notre relation au document, son usage comme source, sa lecture comme matriau unique, digne dintrt ? Je ne parlerai pas ici des questions dauthenticit ou de conservation, traites ailleurs dans ce congrs et bien mieux que je ne saurais le faire. Je souhaite minterroger plutt sur lhistoire culturelle. Jai voqu, jusquici, lexemple du Mtier de bibliothcaire, comme source de lhistoire dune culture professionnelle. Jai considr le Mtier, ses onze ditions, comme un document une srie de documents. son sujet, jai voqu les risques dvanescence, de disparition des sources risque virtuel puisque cet ouvrage est bel et bien dit sous forme papier, dont les ditions successives peuvent tre consultes (mon intervention peut, de ce point de vue, tre considre comme une fiction). Le document, parmi dautres dfinitions, serait, estime lauteur collectif Roger T. Pdauque, un support + un contenu (Pdauque, R.- T., 2003). Ici, des supports successifs (les ditions) correspond un contenu volutif. Mais lauteur et le titre sont inchangs : cest lanalyse de la table des matires et, surtout, du texte lui-mme qui peut mettre en vidence les changements qui affectent une dition aprs lautre. Mais document serait lui-mme un terme plein dambiguts estime finalement ledit Pdauque 20 , qui lui prfre dsormais le terme de texte . En quoi le numrique change-t-il le texte, comme document, comme source pour lhistorien ? Comme chercheur travaillant, dune part, sur lidentit professionnelle des bibliothcaires et, dautre part, sur la bibliothque comme objet de politique publique, jai recours, comme sources, aux discours, argumentations et autres prises de position des professionnels (bibliothcaires) mais
20

Document et texte : permanence et transformations , version du 15-06-2004.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 74/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

aussi des lus et du monde politico-administratif. La sdimentation des textes a donc une grande importance dans mon travail je ne parle pas ici des documents darchives. Plus prcisment, le document qui mintresse, sur lequel je travaille, est rig a posteriori comme source pour lhistorien 21 . Il a au dpart une valeur dusage par exemple, dvaluation pour les rapports dinspection de bibliothque, de communication pour les discours des lus locaux, dargumentation pour les textes manant des bibliothcaires. Cest comme trace quil mintresse aujourdhui et, selon ladage des archivistes, les historiens travaillent sur ce qui est rest . Ces sources imprimes auxquelles jai recours pour mes travaux sont ou peuvent tre accessibles sous forme numrique. Ce qui a des consquences en terme daccessibilit mais pas en termes de dure de vie : un rapport officiel, comme le rapport Borzeix 22 , peut ntre accessible que sous forme numrique, mais il lest de faon permanente, intangible ; un article du Monde, par exemple La culture, fantme des municipales , de Michel Guerrin et Emmanuel de Roux (25-022001), est accessible, intangible, sous forme numrique ou papier ; de mme que le rapport dit du comit interministriel de 1967, La Lecture publique en France 23 , est toujours accessible, inchang. En quoi le stockage ou larchivage sous forme numrique change la dure de vie du document ? En rien sauf problmes techniques, dobsolescence des matriels ou logiciels de lecture. Ce quil change, c'est la possibilit dtre modifi : le lecteur attentif aura not que jai employ le terme intangible ou inchang pour les trois documents que je viens dvoquer or, les versions numriques de ces documents (ces textes) peuvent, bien sr, tre modifies et sans que le lecteur ne le sache sauf lire attentivement la version en ligne et une version antrieure (habilement conserve).Le numrique va-t-il instaurer une nouvelle temporalit, une nouvelle mortalit des documents ? Peut-tre, mais seulement si lon considre que les documents, les textes ont vocation tre modifis aprs leur laboration. Mais la problmatique du colloque nvoque pas ces documents (archivs). (re)lire lappel communication, il semble clair quil sagit de la production de documents quoique la numrisation concerne laccessibilit des documents anciens 24 . Si je lis bien, il sagit mme de la production sinon collective, du moins sous le regard des autres ( en rseau ) : un work in progress au grand jour 25 . Ces documents, ceux dont on parle ici, seraient ainsi alors non pas des documents
21 22

Marc Bloch utilise la formule de tmoignages involontaires . Jean-Marie Borzeix, La question du droit de prt dans les bibliothques , juillet 1998. Accessible sur le site du ministre de la Culture <http://www.culture.gouv.fr/culture/actual/communiq/borzeix.htm> [fvrier 2007]. 23 Paris, La Documentation franaise, 1968. 24 Si lon reporte le contenu dun document (un texte, par exemple) sur un nouveau support, produit-on un nouveau document ? 25 Proche de la formule de Wikipdia que dcrit ainsi Alain Caraco : La Wikipdia en ligne ne peut tre qu'en travaux permanents. C'est une sorte de chaudron bouillonnant, o l'on produit la matire premire, toujours instable. .

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 75/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

constitus en objets de recherche (des matriaux, des sources) mais les travaux de recherche euxmme et encore, uniquement les travaux en cours 26 . On peut largir la question pose celle de la dure de vie des travaux de recherche ou, plus largement, des tudes, essais ou autres analyses. Un livre (de recherche, tude, essais ou analyses) a une dure de vie. Il devient dpass, obsolte, sort des proccupations intellectuelles du temps, nest plus contemporain. Certains sont mis jour, revus, rdits. Dautres non. Des textes, contributions, interventions peuvent tre publis, seuls ou runis en recueil, sur papier ou sur un site Internet. Dautres non. Des travaux dtudiants sont mis en ligne (pour combien de temps ?). Dautres non. Ici, peut-tre faudrait-il rintroduire la notion de travail ditorial ce travail qui apporte autorit et fiabilit un texte. Je suis ici les rflexions de Roger Chartier sur la reconstitution, dans la textualit lectronique, d'un ordre des discours permettant, tout ensemble, de diffrencier les textes spontanment mis en circulation sur le rseau et ceux qui ont t soumis aux exigences de l'valuation scientifique et du travail ditorial, de rendre perceptibles le statut et la provenance des discours et, ainsi, de leur attribuer une plus ou moins forte autorit selon la modalit de leur publication. On reviendrait ainsi la notion essentielle de texte , qui renvoie la fois la notion de contenu (vrifi, valid, mis en forme) et la notion de document (dans le sens de rfrence, quoi on se rfre). Est-ce le support qui importe ou le contenu ? La dure de vie du document ou la dure de vie des ides ? Linformaticien ou lauteur/diteur ? Paul Auster : Il estimait que les textes qu'il donnait aux revues taient lis l'actualit, crits pour des raisons spcifiques des moments spcifiques, et qu'un livre serait pour eux un lieu trop permanent. Il faut les laisser mourir de mort naturelle, m'avait-il dit un jour. Quelques mots de conclusion sur le titre de mon intervention, jug un peu provocateur Il est vrai quun autre titre aurait sans doute t plus en adquation avec le colloque (et avec le contenu de mon intervention). Jaime assez une rhtorique de la lenteur 27 la lenteur qui permet la fois de regarder en arrire et de savourer le got des autres (ltranget, laltrit). Jaime aussi Quelque chose de la stle : Il reste dans tout crit, mme lectronique, quelque chose de la stle monumentale par laquelle lcrit fut dabord diffus. (Michel Melot).
26 27

Ces artefacts particuliers peuvent difficilement, on en conviendra, tre rigs en modles. Patrick Bazin : Lactivit numrique peut sembler produire de loubli aussi rapidement quelle fait prolifrer quantit de textes ou dobjets culturels et en sature les rseaux. Sa capacit mmorielle, pourtant en croissance exponentielle, se mettrait, en ralit, au service dun ternel prsent, sans paisseur. Ce quelle gagnerait en extension, en diversit et en vitesse, largissant rapidement son empire toutes les sphres de lactivit humaine, elle le perdrait en profondeur rtrospective et, surtout, en authenticit, faute de garder racine dans une gnalogie matrielle. Elle serait contradictoire avec toute ide de patrimoine culturel lequel supposerait monumentalit ou, au moins, trace de cette monumentalit. Cette crainte gnre, surtout en France, toute une rhtorique de la lenteur tirant argument de la rsistance des matriaux dinscription, de la progressive sdimentation des archives et de la ncessaire capillarit de la transmission culturelle.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 76/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Bibliographie
Association des bibliothcaires franais (Section des bibliothques publiques), Cours lmentaire de formation professionnelle, 2e d., 1969, 167 p., 27 cm (ronot, copyright Bibliothque nationale). Association des bibliothcaires franais (Section des bibliothques publiques), Cours lmentaire de formation professionnelle, 3e d., 1971, 174 p., 27 cm (ronot, copyright Bibliothque nationale). Association des bibliothcaires franais (Section des bibliothques publiques), Cours lmentaire de formation professionnelle, 4e d., 1974, 141 p., 24 cm, s.l., s.n. (ABF ?) Association des bibliothcaires franais (Section des bibliothques publiques), Cours lmentaire de formation professionnelle, 5e d., 1977, 207 p., 24 cm, s.l., s.n. (copyright ABF ) Association des bibliothcaires franais (Section des bibliothques publiques), Le Mtier de bibliothcaire : cours lmentaire de formation professionnelle, Promodis, 1979, 280 p., 24 cm. Association des bibliothcaires franais (Section des bibliothques publiques), Le Mtier de bibliothcaire : cours lmentaire de formation professionnelle, 7e et nouvelle dition revue et complte, Promodis, 1983, 336 p., 24 cm. Association des bibliothcaires franais, Le Mtier de bibliothcaire : cours lmentaire de formation professionnelle lintention du personnel des mdiathques publiques, 8e dition entirement refondue, coordination : Franoise Froissart, directeur de la BM dAntony, Promodis, ditions du Cercle de la Librairie, 1988, 365 p., 24 cm. Association des bibliothcaires franais, Le Mtier de bibliothcaire : cours lmentaire de formation professionnelle lintention du personnel des mdiathques publiques, 9e dition 1992, coordination : Franoise Froissart, bibliothcaire-consultant et Franoise Hecquard, conservateur Mediadix-Nanterre, ditions du Cercle de la Librairie, 1992, 447 p., 24 cm. Association des bibliothcaires franais, Le Mtier de bibliothcaire, coordination Franoise Hecquard, conservateur la bibliothque dpartementale des Yvelines, avec la collab. de Franoise Froissart, bibliothcaire honoraire, ditions du Cercle de la Librairie, 1996, 527 p., 24 cm. Association des bibliothcaires franais, Le Mtier de bibliothcaire, sous la dir. de Raphale Mouren et Dominique Peignet, ditions du Cercle de la Librairie, 2003, 454 p., 24 cm.

AUSTER, P., Leviathan, Arles, Actes Sud, 1993.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 77/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

BAZIN, P., La mmoire reconfigure , Les Cahiers de mdiologie, n11, 2001. CARACO, A., Wikipdia, une encyclopdie libre, gratuite et crite cooprativement , Bulletin des bibliothques de France, paratre dans le n6, 2004. CHARTIER, R., Lecteurs et lectures l'ge de la textualit lectronique , Text-e : le texte lheure de lInternet, BPI (Etudes et recherche), 2003. MELOT, M., Quest-ce quun objet patrimonial ? , Bulletin des bibliothques de France, n5, 2004. PDAUQUE, R.-T., Document : forme, signe et medium, les reformulations du numrique , d. RTP STIC-CNRS, 2003, <http://archivesic.ccsd.cnrs.fr/sic_00000413> [fvrier 2007]. PDAUQUE, R.-T., Document et texte : permanence et transformations , Version du 15-06-2004, <http://archivesic.ccsd.cnrs.fr/sic_00001003> [fvrier 2007]. Van DOOREN, B., Bibliothques universitaires et nouvelles technologies , 1999, <http://www.education.gouv.fr/cid1927/bibliotheques-universitaires-et-nouvelles-technologies.html> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 78/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Dure de vie du document : ralit et rve de Gutenberg nos jours


Raphale MOUREN Bibliothque Mjanes (Aix-en-Provence) Centre de recherches en histoire du livre, enssib (Villeurbanne)

Il peut paratre trange que dans une runion dont le thme annonc est le numrique : impact sur le cycle de vie du document pour une analyse interdisciplinaire , je me propose de faire un panorama rtrospectif de quelques schmas de dure de vie du document depuis linvention de limprimerie. La raison en est que le texte dappel projet de ce colloque renvoie lui-mme ce pass travers une brve mention de lhistoriographie ; et ce pass parat oubli, signe dune sparation totale entre historiens du livre et spcialistes des sciences de linformation, organisateurs de cette runion. Les historiens du livre, et avec eux les historiens de la culture et des ides, assimils aux bibliographes (dont le travail semble par ailleurs peu apprci), se voient reprocher un manque dintrt pour divers aspects lis la production et la vie du document :
[] La proccupation venue du numrique nous amne rflchir plus globalement sur le fait qu'un document, quels que soient sa nature, son ge, et son utilisation, s'inscrit dans le temps et non dans l'ternit, l'inverse, symboliquement au moins, du monument. Cette dimension temporelle, fortement bouleverse par le numrique, implique des nouvelles faons de faire pour tous les spcialistes de linformation, quels que soient leurs domaines spcifiques dexpertise et les types de documents qu'ils manipulent. Par exemple, les historiens du livre ne se sont pas assez intresss la dure de vie relative des livres imprims de l'poque artisanale, la notion de nouveaut, de rafrachissement, aux formes nouvelles sous lesquelles les documents imprims traversent le temps, proccups qu'ils taient par les problmes de production et d'identification d'ateliers typographiques. Autre sujet d'interrogation pour les historiens : le numrique redonne vie des documents oublis ou renouvelle les modalits de lecture et d'interprtation de documents connus modifiant la relation traditionnelle aux corpus dont les dimensions temporelles doivent tre explicitement prises en compte .
28

Roger Laufer regrettait dj en 1983 labsence de communication entre spcialistes de limprim et du manuscrit, du Moyen ge et des sicles suivants, alors quune mme problmatique
28.

Programme du colloque, <http://www.ebsi.umontreal.ca/rech/ebsi-enssib/ebsi-enssib-programme.html>, disponible aussi sur biblio-fr, 23 janvier 2004 <http://listes.cru.fr/wws/info/biblio-fr> [tous les sites ont t consults en fvrier 2007]. La mise en gras est de moi.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 79/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

gnrale traverse lensemble de la tradition crite, et que cette tradition mme se trouve confronte aux traditions orales redcouvertes et aux nouvelles approches audiovisuelles et informatiques. [] La bibliographie matrielle est une branche de la communication et de linformation. travers ses minuties, elle convie une rflexion grand angle sur les transformations en cours dans le monde daujourdhui 29 . Lapproche du document numrique procde pourtant de la mme complexit que ltude des imprims, qui sont la fois des produits de plusieurs technologies conjugues et des supports douvrages de lesprit , et ce titre concernent des chercheurs de nombreuses disciplines 30 . On notera dailleurs avec optimisme une volution rapide dans la vision que certains spcialistes des sciences de linformation ont de lhistoire du livre : dans le texte publi en 2003 par un groupe de travail franais, auquel participe lenssib (coorganisateur de notre colloque), sur Document : forme, signe et relation, les re-formulations du numrique, les auteurs anonymes considraient que les connaissances acquises sur le premier aspect, forme , viennent des savoir-faire professionnels , lexclusion des chercheurs ; ceux-ci jouent leur rle dans la question du signe, mais uniquement en observateurs : les linguistes sont cits, mais pas les philologues. Quoi quil en soit, lhistoire du livre est totalement absente de la question de la forme . Quant la bibliographie matrielle, elle napparat quentre guillemets31 . En 2004, si lignorance des travaux reste inchange, la discipline est reconnue. Lexclusion entre domaines qui paraissent pourtant complmentaires est un phnomne rcurrent : Wallace Kirsop, le grand spcialiste de la bibliographie matrielle, regrettait en 1983 le dsintrt total des littraires diteurs du thtre du
XVII
e

sicle pour lhistoire du livre et les bourdes que leur faisait commettre leur

ignorance de la manire dont les livres taient imprims et vendus lpoque 32 . On a donc souhait ici simplement faire connatre les travaux mens depuis un peu plus de vingt ans par lhistoire du livre sur les notions cites par le texte de prsentation de notre colloque. Par un retour sur la bibliographie, relue dans les directions suggres par ce programme, sont prsents ici des exemples permettant de rappeler ce que les historiens du livre ont pu mettre en lumire sur le cycle de vie du document depuis la mcanisation de sa fabrication au tournant des
29. 30.

Roger Laufer, Avant-propos , dans La bibliographie matrielle, Paris, ditions du CNRS, 1983, p. 12. Roger Laufer, La bibliographie matrielle : pourquoi faire ? , dans La bibliographie matrielle, op. cit., p. 13. 31. Document : forme, signe et relation, les re-formulations du numrique, d. RTP STIC-CNRS [pseudonyme Roger T. Pdauque], <http://archivesic.ccsd.cnrs.fr/sic_00000413.html>, 2003, passim (abrg dsormais sous la forme RTP). 32. Wallace Kirsop, Le thtre franais du XVIIe sicle, ou la bibliographie matrielle mise lpreuve , dans La bibliographie matrielle, op. cit., p. 87-101.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 80/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

annes 1450. Une lecture particulirement attentive est faite douvrages devenus incontournables pour les spcialistes comme pour les futurs bibliothcaires 33 . On tentera un parallle avec les nouvelles proccupations des chercheurs propos du document numrique 34 . Lexpression cycle de vie du document permet de traiter du texte lui-mme intellectuellement, ou de lexemplaire imprim, si lon sen tient par exemple la dfinition du document donne par le Dictionnaire encyclopdique du livre : ensemble form par un support et les donnes ou les informations qui y sont stockes, enregistres 35 , bien plus prcise que celle du dictionnaire Le Petit Robert : crit, servant de preuve ou de renseignement 36 . Lun et lautre apparaissent ici. Certains spcialistes de sciences de linformation entendent par ce terme un objet beaucoup plus complexe, mais fondamentalement trs spcifique et ne recouvrant pas lacception courante du mot. Le texte dj cit Document : forme, signe et relation, les re-formulations du numrique a ainsi travaill sur la notion de document, entendu dans un sens bien spcifique (voire hyper-spcialis) ; il se proposait de prciser la notion de document dans son passage au numrique partir de recherches qui privilgient plutt la forme (comme un objet matriel ou immatriel), le signe (comme un porteur de sens) ou la relation (comme un vecteur de communication) . Le texte provisoirement dfinitif 37 cherche rpondre aux proccupations des chercheurs des sciences de l'information , tout en identifiant comme pouvant sintresser cette notion de document les historiens (en particulier les archologues), les gographes, les juristes Prenant pour acquis que le numrique a apport des transformations radicales la notion de document sans sy arrter plus avant, ce texte sintresse essentiellement au document structur suivant les normes en usage sur le world wide web, parfois multimdia et pas particulirement destin prendre une forme imprime structure, ainsi quaux anciens documents [qu] il va falloir traduire en documents numriques . Il exclut en particulier de la notion de document ce qui na pas t communiqu, et communiqu largement, c'est--dire publi sous quelque forme que ce soit, ou ce qui a t communiqu mais na pas t enregistr, comme une mission de radio. Une telle coupure entre le document avant et aprs linvention de linformatique nayant pas fait lobjet dune rflexion pralable, et le document considr par ce groupe de
33.

Il sagit donc volontairement dune bibliographie qui, loin dtre compose exclusivement darticles pointus drudition, utilise des ouvrages publis pour un plus large public : lobjectif est bien ici de mettre en lumire des aspects bien connus de lhistoire du livre du moins chez les historiens du livre , dans une perspective nouvelle. 34. On dduit du texte cit que les questions de nouveaut, de rafrachissement et de formes nouvelles du document font partie de la proccupation du numrique . 35. Marie-Hlne Prvoteau, art. Document , dans Pascal Fouch, Daniel Pchoin, Philippe Schuwer (dir.), Dictionnaire encyclopdique du livre, vol. 1, Paris, d. du Cercle de la Librairie, 2002. 36. dition consulte : Le CD-Rom du Petit Robert, version 2.0, 2001. 37. Jean-Michel Salan, biblio-fr, 9 juillet 2003.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 81/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

travail tant trs spcifique (de mme que la notion darchive, prise arbitrairement dans un sens trs restreint), il a sembl plus prudent de sen tenir une dfinition du document large. Les travaux du RTP continuent, et le texte de juillet 2003 annonce une rflexion affine sur les ruptures et continuits entranes par linvention du numrique (mot qui reste dfinir lui aussi). Au final, pour pouvoir comparer des objets proches, ce sont les cycles de vie du livre qui sont compars dans ces pages, au fil du temps et de ce quon appelle dsormais ses trois rvolutions 38 : linvention de la typographie, la mcanisation de lpoque industrielle, linformatisation. Le document ici est toujours un livre, cet objet matriel ou immatriel dont les finalits fonctionnelles [sont] transmettre du texte, le plus lisiblement et le plus durablement possible 39 . On sattardera sur ces trois rvolutions du livre, qui, on le verra, nen sont pas dans tous les domaines. Si en 1983 Elisabeth Eisenstein pouvait prendre comme point de dpart de son travail, accept sans discussion, lide que linvention de limprimerie fut une rvolution des communications 40 , elle citait pourtant en conclusion Hugh F. Kearney, pour qui la construction de la modernit commence aux copernicienne lentement ?
38.

XVII

et

XVIII

sicles, au moment de la rvolution

41

. Trois rvolutions, voire quatre ? Ou bien des vitesses dvolution variables, lies

aux nouvelles techniques dcouvertes par lhomme et aux modifications quelles entranent, parfois

Ainsi dans deux livres rcents : Frdric Barbier (dir.), Les trois rvolutions du livre : actes du colloque international de Lyon/Villeurbanne (1998), Genve, Droz, 2001, et Alain Mercier (dir.), Les trois rvolutions du livre : catalogue de lexposition du muse des Arts et Mtiers, 8 octobre 2002-5 janvier 2003, Paris, Imprimerie nationale, 2002. 39. Dominique Coq, Lapparition du livre avec Gutenberg : le changement dans la continuit , dans Alain Mercier, Les trois rvolutions du livre, op. cit., p. 163-167 (163). Le sens de livre dans histoire du livre peut aussi accepter une dfinition large : il ne prend pas en compte par exemple la diffrenciation faite par lUnesco entre livre et brochure, qui nest pas la mme que celle de lAmerican National Standards Institute. Pour une recherche de dfinitions du livre voir Jean-Claude Utard, Les documents imprims : livres et priodiques , dans Dominique Peignet, Raphale Mouren (dir.), Le mtier de bibliothcaire, Paris, ditions du Cercle de la Librairie, 2003, p. 155-163. 40. Elizabeth L. Eisenstein, The Printing Revolution in Early Modern Europe, Cambridge, Cambridge University Press, 1983. 41. Hugh F. Kearney, Origins of the Scientific Revolution, London, Longmans, 1966, p. XI. Lexpression rvolution copernicienne renvoie entre autres louvrage de Thomas Samuel Kuhn, The Copernician Revolution : Planetary Astronomy in the Development of Western Though, Cambridge (Mass.), Harvard University Press, 1957.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 82/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Dure de vie des formes successives du document


42

Larrive de limprim a-t-elle tu le manuscrit

En 1982, Dominique Coq, dans le premier volume de lHistoire de ldition franaise, attirait lattention sur le risque quil y a, pour de multiples raisons, considrer lapparition de limprim comme une rupture 43 . Il proposait dexpliquer la tardive impression Paris de livres trs lus jusqualors par le fait que de nombreux manuscrits existaient, taient aisment disponibles (pour les universitaires particulirement) et circulaient : les diteurs aviss auraient donc hsit publier un texte alors que le march tait dj satur de copies manuscrites. Labsence de publication nest alors pas le signe dun manque de popularit : comment en douter pour lImitatio Christi ou les Sentences de Pierre Lombard ? D. Coq propose divers exemples, dans plusieurs domaines, montrant des rythmes dvolution diffrents : au
XV
e

sicle le grand veneur du roi, souhaitant lire le Propritaire des

choses de Barthlmy lAnglais, fait copier lidentique limpression lyonnaise de J. Syber 44 , y compris les gravures sur bois devenues miniatures 45 . Dans les dernires annes du sicle commencent tre publis Paris des livres en langue vernaculaire. La production de ces textes sur manuscrit tait particulirement bien organise, adapte un public spcifique, aristocratique, et cest un copiste spcialis dans ce domaine, Colard Mansion, qui se lana dans la typographie en produisant des livres strictement semblables aux manuscrits qui sortaient de ses ateliers ; seule la technique de fabrication est diffrente 46 . Les habitudes de travail se seraient donc modifies petit petit 47 . Les publications universitaires corroborent cette hypothse : au dbut du
XVI
e

sicle, les textes de base lusage des

tudiants dbutants, les artiens, sont rimprims de multiples fois. Les grands textes patristiques et scolastiques, eux, trs utiliss pourtant la facult de thologie, manquent lappel. Le dveloppement de limprimerie na pas t concomitant une modification de lapproche
42.

Manuscrit peut avoir des sens plus ou moins prcis suivant la discipline de celui qui lutilise. On verra louvrage ancien mais indispensable dAlphonse Dain, Les manuscrits, Paris, Les Belles Lettres, 1949, rd. 1963, 1975 avec de nouvelles prfaces ; rimpr. [s.l.], Diderot diteur, coll. Pergame, 1998, p. 12-14. 43. Dominique Coq, Les incunables : textes anciens, textes nouveaux , dans Henri-Jean Martin, Roger Chartier (dir.), JeanPierre Vivet (coll.), Le livre conqurant : du Moyen ge au milieu du XVIIe sicle, dans Histoire de ldition franaise, tome 1, Paris, Promodis, 1982, p. 177-193. 44. Le copiste a recopi aussi le colophon, comme le faisaient parfois aussi les copistes mdivaux dun manuscrit un autre. 45. BnF, ms. fr. 218, renseignement fourni par Franois Avril D. Coq : Dominique Coq, ibid., p. 185. 46. Dominique Coq, ibid., p. 188. 47. Cest dans cette mesure quon peut affirmer que lintroduction de limprimerie, en France en tout cas, na pas boulevers de manire essentielle et subite les habitudes de ceux qui taient accoutums lire (les doctes, les clercs, les hommes de loi), ni les pratiques des libraires ; elle parat davantage tre un stimulant quune rponse une augmentation des besoins si forte que les techniques de fabrication traditionnelles auraient t incapables dy faire face. On a ainsi souvent tendance surestimer limportance du nouveau medium [] (Dominique Coq, ibid., p. 177).

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 83/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

scientifique de ldition ; Edward Kenney considre mme que du point de vue de lditeur de texte (au sens scientifique), du philologue, cette invention naurait pas pu apparatre un pire moment 48 . Lobjectif ntait pas encore de runir les tmoins dune tradition, den tablir le stemma, den identifier les tmoins utiles, et de les collationner pour tablir un texte le plus proche possible de loriginal 49 : on produisait simplement de nouvelles copies dun texte, en recopiant un manuscrit dont on pouvait disposer. Lexemplaire imprim navait alors aucune raison, autre quconomique, dtre davantage recherch par les clercs que le manuscrit. Comme par ailleurs lapparence de limprim ntait pas diffrente de celle du manuscrit, ce dernier nest pas apparu tout dun coup comme dpass 50 . Certains humanistes (c'est--dire les professeurs dhumanits) pourtant, depuis un sicle, travaillaient amliorer les textes. Des contingences extrieures ralentirent cette volution (voir infra), mais la recherche du meilleur texte comme base de ldition apparut assez vite, Paris et en Italie par exemple et moins Lyon ; Guillaume Fichet, qui a introduit limprimerie la Sorbonne, voulait dj fabriquer des livres rapidement, correctement et lgamment 51 . Lintrt pour limprim grandit, pour un certain nombre de documents et dans certains milieux : si un manuscrit des Sentences de Pierre Lombard continue circuler parmi les tudiants, vivre dune certaine faon, on peut penser quil nen est dj plus de mme pour Salluste, pour Lorenzo Valla Par ailleurs les humanistes se rendent vite compte des possibilits techniques nouvelles offertes par limprim. On en prendra deux exemples :
en 1509 Jacques Lefvre dtaples dite chez Henri Estienne un Psautier : simple livre de pit certes, mais il choisit de prsenter en vis--vis cinq versions diffrentes, partir de manuscrits des monastres parisiens : il ne sagit dj plus simplement de donner lire, mais de prsenter une uvre crite, dans une approche humaniste mais aussi toujours thologique
52

(figures 1 et 2) ;

entre 1514 et 1517 est dite Alcal de Henares la Bible polyglotte en six tomes, norme entreprise mene par le cardinal Cisneros qui a runi autour de lui des
48.

Edward J. Kenney, Testo e metodo : aspetti delledizione dei classici latini e greci nellet del libro a stampa, d. rev. par Aldo Lunelli, trad. Giovanni Ravenna, Rome, Gruppo editoriale internazionale, 1995, p. 1 (traduction de The Classical Text : Aspects of Editing in the Age of the Printed Book, Berkeley Los Angeles London, University of California Press, 1974 (Sather Classical Lectures, 44). 49. Sur lvolution des techniques ddition, commence au XVe sicle avant linvention de limprimerie et continue tout au long des sicles suivants, voir les ouvrages de base : E. J. Kenney, op. cit. ; Giorgio Pasquali, Storia della tradizione e critica del testo, Firenze, Le Monnier, 1934, rimpr. 1952, rd. Firenze, Le lettere, 1988 ; Sebastiano Timpanaro, La genesi del metodo del Lachmann, Firenze, Le Monnier, 1963, rd. corr. et augm. Padova, Liviana ed., 1981, rimpr. corr. et augm. ibid., 1985, rimpr. 1990. 50. Volumes manuscrits et volumes imprims, vhiculant les mmes textes, se sont longtemps ctoys sans distinction dans les bibliothques des contemporains ; ils taient vendus par les mmes libraires, rubriqus et relis par les mmes artisans : Dominique Coq, Lapparition du livre avec Gutenberg , op. cit., p. 163. 51. Dominique Coq, ibid. 52. Genevive Guilleminot, dans Antoine Coron (dir.), Des livres rares depuis linvention de limprimerie, [catalogue de lexposition], [Paris], Bibliothque nationale, 1998, p. 56-57.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 84/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

spcialistes venus parfois de loin. Elle contient le Nouveau Testament en latin et en grec, et le Pentateuque en hbreu, aramen, grec et latin
53

(figure 3).

Cette approche des textes sacrs se heurta une actualit religieuse et politique contraire, comme on le verra plus loin. Elle ne concerna pas gnralement lensemble de la littrature religieuse : les textes de pit, les textes religieux les plus lus nont pas subi de modification particulire avec larrive de limprim.

Figure 1. Quincuplex Psaltarium. Gallicum. Romanum. Hebraicum. Vetus. Conciliatum, Paris, H. Estienne, 1509. Bibliothque Mjanes (Aix-en-Provence) Rs. Q. 179, Page de titre. Figure 2. Quincuplex Psaltarium. Gallicum. Romanum. Hebraicum. Vetus. Conciliatum, Paris, H. Estienne, 1509, petit in-folio. Bibliothque Mjanes (Aix-en-Provence) Rs. Q. 179. F. 86v. Le texte est imprim en noir et rouge : la feuille est passe deux fois sous la presse. Clichs CCL-Cit du Livre Ville dAix-en-Provence. Droits rservs.
53.

Julin Martn Abad, La imprenta en Alcal de Henares (1502-1600), intr. Jos Simn Daz, vol. 1, Madrid, Arco Libros, 1991 ; Martine Delaveau, Denise Hillard, d., Bibles imprimes du XVe au XVIIIe sicle conserves Paris : Bibliothque nationale de France, bibliothque Sainte-Genevive, bibliothque de la Sorbonne, bibliothque Mazarine, bibliothque de la Socit de lhistoire du protestantisme franais, bibliothque de la Socit biblique, catalogue collectif, Paris, Bibliothque nationale de France, 2002, notices 1-2.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 85/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Figure 3. [Bible], Alcal de Henares, In Complutense Universitati, sumptibus Francisci Ximenez de Cisneros, Industria Arnaldi Guillelmi de Brocario, 1514-1517. Bibliothque nationale de France, Arsenal FOL-T-1.

Ainsi il nous faut nuancer une vision schmatise du manuscrit entendu au sens de support permettant de prendre connaissance dune uvre de lesprit qui meurt avec larrive de limprim, pour ntre plus quun outil pour ldition : cette modification cette nouvelle vie napparat que graduellement. La fin annonce dun cycle, celui du livre copi la main, ou plus prcisment celui du livre crit en criture minuscule sur un codex de parchemin puis de papier, nest en ralit survenue que fort tard, voire mme jamais. Continuit dans la rvolution 54 , donc, autant dans les aspects qui nous occupent aujourdhui que pour de nombreuses raisons qui touchent laspect matriel du document et son contenu.

54.

Dominique Coq, Lapparition du livre avec Gutenberg , op. cit., p. 166.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 86/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Comme Dominique Coq propos de la premire rvolution du livre , Frdric Barbier a relev quel point les termes de deuxime rvolution du livre sont mal choisis, contraires quils sont lvolution quobserve lhistorien 55 . Il reste encore tudier si la troisime rvolution du livre est, elle aussi, un raccourci trop rapide dformant la ralit. Larrive du numrique a-t-elle tu limprim ? Au-del des aspects symboliques (voir infra), longtemps le numrique na modifi en rien le livre, et la remarque dEzio Ornato sur le manuscrit et limprim sapplique tout autant cette troisime rvolution :
[] lattitude des imprimeurs face au march quil sagissait darracher au manuscrit a t lexact pendant de celle de certains hommes politiques mais en sens inverse : alors que les politiciens essaient souvent de faire croire que des changements superficiels constituent une vritable rvolution, les imprimeurs ont fait rellement la rvolution en donnant au lecteur lillusion que rien, dans la page crite, navait chang .
56

Les deux attitudes ont pu tre observes pour le document numrique, de ldition lectronique au e-book au succs si limit. Comme les humanistes avec limprim, leurs successeurs, les philologues daujourdhui, ont aussi t parmi les premiers, en sciences humaines du moins, se rendre compte des possibilits nouvelles offertes par ldition lectronique : grce la numrisation dditions imprimes, ils ont dispos trs tt dimmenses corpus permettant de consulter dun seul clic plusieurs sicles de littrature : le Thesaurus Lingu Grc (TLG), gr par un centre de recherche de l'Universit de la Californie, Irwine, existe depuis 1972. Complte par lindispensable Thesaurus Lingu Grc Canon of Greek Authors and Works (dabord dit en volume et maintenant lectronique lui aussi), la dernire version du TLG propose toute la littrature grecque depuis Homre jusqu' la chute de Constantinople (3 500 auteurs et 11 000 uvres). Le TLG fut propos sous forme lectronique ds 1985 sans logiciel dinterrogation, et les premiers moteurs furent dvelopps pour les systmes Apple, plus utiliss par les spcialistes de lAntiquit : Pandora dabord, ainsi quun logiciel spcialement dvelopp par la Scuola normale superiore de Pise, SNS Greek & Latin, signe dune prise en main relle de cet outil par des littraires quon a dit parfois longtemps rfractaires loutil informatique 57 . Le Thesaurus est maintenant disponible en ligne 58 . Le TLG et les autres corpus de
55.

Frdric Barbier, Lindustrialisation des techniques , dans Henri-Jean Martin, Roger Chartier (dir.), Jean-Pierre Vivet (coll.), Le temps des diteurs : du Romantisme la Belle poque, dans Histoire de ldition franaise, tome 3, Paris, Promodis, 1985, p. 56-67. 56. Ezio Ornato, La face cache du livre mdival : lhistoire du livre vue par Ezio Ornato, ses amis et ses collgues, prf. Armando Petrucci, Rome, Viella 1997 (I libri di Viella, 10), p. 156. Cit par Dominique Coq, ibid. 57. Sur lhistoire des diffrents moteurs de recherche dvelopps pour Apple et PC voir larticle de Daniel Bguin, Les antiquisants face l'informatique et aux rseaux [document lectronique], Paris, cole normale suprieure, 1996. Disponible sur le site : <http://barthes.ens.fr/atelier/articles/ArticleInternetnov96.html> [fvrier 2007]. 58. La version complte est payante, mais une version abrge est disponible sur <http://www.tlg.uci.edu/> [fvrier 2007]. De nombreux autres corpus sont dsormais disponibles : voir leur prsentation sur le site des Signets de la Bibliothque

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 87/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

textes du mme type, tendant lexhaustivit dans leur domaine, proposent tous plusieurs milliers de textes et parfois mme des dictionnaires numriss disponibles simultanment ; ils ont profondment modifi la manire de travailler de ces scientifiques. tablir des parallles, tudier le vocabulaire dun auteur ne sont plus des enjeux mais des pralables toute recherche 59 . Un autre domaine de sciences humaines sensible trs tt ces apports a t lhistoire mdivale. En France, bien avant linvention du mot numrique , des chercheurs spcialistes du texte (forme et contenu) se sont penchs sur les progrs que pouvait apporter linformatique pour ltude du document, comme le montrent le bulletin Le Mdiviste et lordinateur, qui existe depuis 1979 et est dsormais lectronique 60 , et les travaux entrepris ds cette poque par lInstitut de recherche et dhistoire des textes du CNRS. Aujourdhui on peut voir une complmentarit entre limprim et llectronique : les vastes corpus numriques permettent de trouver le texte que lon cherche, de lancer des recherches lexicographiques ; les ditions savantes imprimes, par leurs doubles ou triples appareils critiques, offrent au chercheur la possibilit de travailler vraiment sur le texte, en prenant connaissance des leons divergentes des manuscrits et des diteurs passs 61 .
Consquences de linvention de la page de titre : vendre du vieux pour du neuf

Lapparition de la page de titre dans les incunables a t tudie depuis longtemps. La premire, en 1476 Venise, est celle du Kalendarium de Regiomontanus publi par Erhard Ratdolt, Bernhard Maler et Peter Lslein 62 . Albert Labarre a signal lutilisation trs tt de la page de titre pour remettre neuf un livre imprim depuis plusieurs annes : un missel lusage de Verdun, imprim par Jean Dupr Paris en 1481 daprs le colophon, comporte un titre en deux lignes. Lalmanach qui se trouve en dbut de volume commence en 1492, et par ailleurs, les missels imprims par Dupr entre 1481 et 1488 ne portent pas de page de titre. Albert Labarre supposait donc que dj, une page de titre avait t ajoute en 1491 un livre imprim depuis dix ans 63 .
nationale de France : <http://www.bnf.fr>, et sur le portail Menestrel : <http://www.ext.upmc.fr/urfist/mediev.htm> [fvrier 2007]. 59. Cette mutation profonde car cen est bien une des mthodes de travail de ces historiens nest pas sans danger et peut entraner des approches mthodologiques moins fiables, mais ce nest pas le lieu dy rflchir ici. 60. <http://lemo.irht.cnrs.fr> [fvrier 2007]. 61. Il est remarquable et regrettable que ces ditions double apparat critique restent impossibles crer automatiquement dans les logiciels de traitement de texte les plus courants, qui nont pas encore cherch sadapter cette mthode de travail pourtant pluricentenaire. Les chercheurs savent bien que des questions techniques restent rgler : comment en effet travailler sur un traitement de texte tout en consultant une dition lectronique dun texte ancien, un usuel rcent sous forme numrique, un dictionnaire lectronique le tout sur un seul cran ? Pour peu quil dispose de vues numrises et de microfilms dun ou plusieurs manuscrits, le philologue perdra vite le fil de ses collations. 62. Christoph Reske, De Venise Augsbourg : Erhard Ratdolt, un imprimeur dexception , dans Alain Mercier (dir.), Les trois rvolutions du livre, op. cit., p. 189-191. 63. Albert Labarre, Les incunables : la prsentation du livre , dans Histoire de ldition franaise, tome 1, op. cit., p. 197.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 88/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Un autre exemple plus frappant peut-tre est celui de l'editio princeps d'Isocrate, publie Milan en 1493 : elle est remise en vente en 1535, soit 42 ans plus tard, avec une nouvelle page de titre, mais aussi plus subtil et plus proche encore de la volont de tromper sur la marchandise un nouveau colophon. Le premier colophon indiquait que le livre avait t prpar par Demetrios Chalcondyle (uJpoV Dhmhtrivou tou' Calkonduvlou), et imprim par Ulrich Scinzenzeler et Sebastiano de Pontremoli (uJpoV jErrivkou tou' germanou' kaiV Sebastianou tou' ejk Pontremouvlou) aux frais de Bartolomeo Squassi, Vincenzo Alipranti et Bartolomeo Rozoni (Barqolomai'o" Skuvaso" Bikevntio" jAlivpranto" Barqolomai'o" Jrovzwno"). Une gnration plus tard, et alors que lapparence extrieure des livres a bien chang et ne ressemble plus lincunable, le titre est en latin : Isocratis orationes XXI alias a Demetrio Calcondylo primum Mediolani correctae, et editae : nunc autem iterum accurate recognitae et impressae emittuntur, Venetiis 1535. Les discours dIsocrate ont t nouveau tudis et imprims , annonce sans vergogne le titre. On sait que les livres grecs taient longs couler, quelques exceptions prs, et certains imprimeurs qui pourtant avaient la capacit de le faire, refusaient fermement dditer les uvres de lAntiquit grecque ou mme des pres de lglise 64 . Ces cas de livres remis neuf, pour lesquels un imprimeur a contrari le cycle de vie en tentant de relancer les ventes, tout en faussant le jugement de lacheteur en lui montrant un livre neuf , ne sont pas la marque dune priode prcise. Ces pratiques ont toujours continu, tombant parfois dans la contrefaon pure et simple. Elles ont pu dans ce cas tre inverses, lditeur faisant passer pour la premire dition une simple rdition. Il faut alors beaucoup dattention au bibliographe pour rtablir la vrit 65 . Aujourdhui certaines rimpressions anastatiques sont moins identifiables que dautres, seule une bonne connaissance de la bibliographie vite parfois de tomber dans le pige dun catalogue dditeur un peu trop succinct et permet de savoir que plus dun sicle sest coul depuis la premire parution dun livre. La reproduction numrique douvrages anciens, qui leur assure une nouvelle diffusion et en fait des documents numriques, a parfois le mme effet. La consultation du catalogue de la bibliothque numrique Gallica est parfois complique par la cration de ces nouveaux documents
64.

tude dj mene dans Raphale Mouren, Les philologues et leurs diteurs au XVIe sicle , dans La memoria de los libros : estudios sobre la historia del escrito y de la lectura en Europa y America, tome 1, Salamanca, Instituto de historia del libro y de la lectura, 2004, p. 495-507. 65. Un exemple particulirement spectaculaire a t donn par John Carter et Graham Pollard, qui en publiant en 1934 An Enquiry into the Nature of certain Nineteenth Century Pamphlets, dmontrrent que des plaquettes considres comme des ditions originales fort rares du XIXe sicle ntaient que des contrefaons plus tardives : Nicolas Barker, La contrefaon littraire au XIXe sicle et la bibliographie matrielle , dans La bibliographie matrielle, op. cit., p. 43-52.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 89/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

numriques, les notices pouvant indiquer la date de numrisation, et non pas la date ddition du document numris.
Circonstances extrieures : fins de cycles, renaissances multiformes et nouvelles apparitions
Imprimerie et thologie

La vie du document est bien entendu lie de fort nombreuses contingences extrieures. Au
XVI
e

sicle, elles peuvent tre religieuses : lApologie publie par Pic de la Mirandole lors de son

passage Paris en 1485-86 est dtruite deux ans plus tard par les docteurs de la facult de thologie de Paris 66 . En 1509 le Psautier publi par Jacques Lefvre dtaples, cit plus haut, est le seul de ses livres qui nest pas condamn par la facult de thologie. Entre 1514 et 1517 sortent les volumes de la Bible polyglotte, on la vu ; en 1516 rasme publie son Nouveau Testament grec : lapproche philologique de ces ouvrages ne provoque pas de raction. En 1534 les choses ont chang : la facult de thologie surveille de prs les publications, et limprimeur Antoine Augereau, qui avait dit des Colloques drasme et le Miroir de lme pcheresse de Marguerite de Navarre, finit sur le bcher loccasion de laffichage des placards des Articles vritables sur les horribles grandz et importables abuz de la messe papalle [] 67 . La surveillance des textes sacrs est aussi trs attentive. Le 10 dcembre 1543, le Conseil du Roi interdit dimprimer et de vendre des Bibles, Nouveaux Testaments et indices de Robert Estienne : limprimeur, qui avait tant fait scandale en 1528 avec son dition de la Vulgate, tait pourtant devenu imprimeur du roi en 1539 68 . Estienne part alors pour Genve, et le durcissement des positions, du ct de lvolution vers la Rforme comme de la raction catholique, stoppent en France pour longtemps ces ditions des textes sacrs, qui cherchaient, comme le faisaient alors les humanistes pour les textes classiques, tablir au mieux le texte en ne laissant pas les arguments thologiques dcider pour eux. En ralit la situation est plus confuse, et diffrente suivant les pays. La position royale fut fluctuante et en 1561 un an aprs la conjuration dAmboise et quelques mois avant le dbut des guerres de religion Antoine Vincent (membre du Consistoire rform cr Lyon de 1561 1564) obtient un privilge royal pour le Psautier en franais pour la Religion et lglise rforme 69 .
66.

Henri-Jean Martin, et Jeanne-Marie Dureau, Annes de transition : 1500-1530 , dans Histoire de ldition franaise, tome 1, op. cit., p. 217-225 (224). 67. Jeanne Veyrin-Forrer, Antoine Augereau, graveur de lettres, imprimeur et libraire parisien (1534) dans Eadem, La lettre et le texte : trente annes de recherches sur lhistoire du livre, Paris, cole normale suprieure de jeunes filles, 1987, p. 3-50 (premire publication dans Paris et le-de-France : mmoires publis par la Fdration des socits historiques et archologiques de Paris et de lle-de-France, 8, 1956, p. 103-156). 68. Henri-Jean Martin, Le temps de Robert Estienne , dans Histoire de ldition franaise, tome 1, op. cit., p. 231-234. 69. Natalie Zemon Davis, Le monde de limprimerie humaniste : Lyon , dans Histoire de ldition franaise, tome 1, op. cit., p. 277.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 90/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Ailleurs les protections cardinalices laissrent parfois plus de liberts aux humanistes pour ldition philologique de textes sacrs ; celle-ci survcut dans les pays catholiques, reprise en main par la Curie romaine et les rois : le cardinal Granvelle Anvers, qui surveille pour Philippe II dEspagne la deuxime Bible polyglotte, celle de Christophe Plantin ; le cardinal Cervini Rome, qui depuis Trente o il reprsente le pape au Concile suit pas pas les ditions des pres de lglise et des auteurs chrtiens. Un homme dglise aussi rudit que ce futur pape, au moment de ldition dun trait de Thodoret, na pas seulement dans cette entreprise les ambitions humanistes affiches par son grand projet ddition mene depuis plusieurs annes : ce livret, cest le Contra haeresos, quil faut diter pour y trouver des arguments contre les Protestants, et il faut surtout lditer en le faisant vrifier par des thologiens ; rien ne doit y tre contraire la doctrine de lglise de Rome. Guglielmo Sirleto, lditeur charg du projet, tout humaniste quil ait pu tre lui-mme, futur cardinal et futur responsable de la Bibliothque vaticane, tait bien du mme avis 70 . Une nouveaut importante avait t introduite avec leffort des humanistes pour rtablir les textes, pour amliorer la qualit des documents mis disposition du public par le biais de limprim. Dans tous les autres domaines, ces efforts continuent, comme suffisent en tmoigner les mentions que lon retrouve souvent sur les pages de titres, annonant des nouvelles traductions, de nouveaux commentaires Pour la Bible, il faut attendre Richard Bentley et ses Proposals for a New Edition of the Greek Testament, publis Londres en 1720 qui rencontre lui aussi lopposition des thologiens 71 . On aurait pu citer dautres domaines dintervention dans le cycle de dveloppement et de vie du livre en gnral ou dun type particulier de document. La censure eut bien dautres raisons que la religion. Le politique et le lgislatif ont rgi ces dveloppements ; aprs la libert de la Fronde, Colbert reprend en main la librairie en 1667 72 . La censure est attentive aux Lumires et lvolution de lidologie 73 . Tout est surveill, le nombre dimprimeurs et dapprentis mme est rgl. Aprs la Rvolution, le XXIe sicle connat des priodes de surveillance plus ou moins grande jusquaux lois de Jules Ferry de 1881 et au dveloppement qui suit lassouplissement du cadre lgislatif 74 . La censure la plus attentive nempcha pas les textes dtre publis, distribus, et
70.

Raphale Mouren, La lecture assidue des classiques : Marcello Cervini et Piero Vettori , dans Humanisme et glise entre France et Italie, du dbut du XVe sicle au milieu du XVIe sicle, colloque, Rome, 2000, d. Patrick Gilli, Roma, cole franaise de Rome, 2004 (Collection de lcole franaise de Rome, 330), p. 433-463 ; Alain Tallon, La France et le Concile de Trente, Roma, cole franaise de Rome, 1997 (Bibliothque des coles franaises dAthnes et de Rome, 295), p. 746-747. 71. Sebastiano Timpanaro, La genesi del metodo del Lachmann, rd. corr. et augm. Padoue, Liviana ed., 1990, p. 23. 72. Henri-Jean Martin, La direction des lettres , dans Henri-Jean Martin, Roger Chartier (dir.), Jean-Pierre Vivet (coll.), Le livre triomphant 1660-1830, Histoire de ldition franaise, tome 2, Paris, Promodis, 1984, p. 64-75 73. Daniel Roche, La censure , dans Histoire de ldition franaise, tome 2, op. cit. p. 76-83 et La police du livre , ibid., p. 84-91. 74. Isabelle de Conihout, La Restauration : contrle et libert , ibid., p. 536-541 ; Frdric Barbier, Une production multiplie , dans Histoire de ldition franaise, tome 3, op. cit., p. 102-121.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 91/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

davoir une vie cache, certes (ou du moins pas prsente au public dans les boutiques des libraires), mais relle 75 . Les projets de loi franais, en ce dbut de
XXI
e

sicle, destins suivre la

directive europenne sur les droits dauteur dans la socit de linformation, inquitent la communaut des bibliothcaires qui y voient une limite la mise disposition de linformation, et tout particulirement des documents lectroniques 76 . Le principal motif qui dcide de la vie, de la mort et de la renaissance des livres est bien entendu conomique : il mriterait une intervention lui tout seul, des livres impossibles vendre lavnement dune re o les tirages des livres sont adapts instantanment la demande (retirages, ditions de poche, version cdrom), et o les tarifs daccs aux documents lectroniques les plus importants font lobjet de dures ngociations entre diteurs et bibliothques universitaires amricaines. Lre de la culture de masse, dont Jean-Pierre Rioux et Ludovic Tourns annoncent la fin 77 , a connu la suprmatie des choix conomiques, quen sera-t-il de lavenir 78 ?
Nouveau ou renouvel ?

La notion de nouveaut cite dans le texte programmatique de ce colloque est difficile saisir. La nouveaut, pour un document imprim, peut apparatre dans le contenu, on la vu, comme dans la forme. Mais nen est-il pas de mme pour les documents faussement dits virtuels, pour lesquels une nouvelle mise en page (dans le cas dune vritable dition lectronique), ou bien une refonte de la page de prsentation (home page), quivalent technologique pourrait-on dire des somptueuses jaquettes qui apptent et trompent parfois lacqureur dun beau livre (cest-dire cher) suffisent faire croire la nouveaut ? Document imprim et lectronique se rejoignent lorsquils sont un seul et mme document prsent de deux faons diffrentes : le Petit Larousse illustr est remis jour chaque anne depuis sa cration il y a exactement cent ans. Il est dsormais dit sous forme papier et sous diffrentes formes lectroniques, toutes mises jour annuellement. Les contenus principaux, les entres du dictionnaire sont les mmes, enrichis dune faon ou dune autre suivant la version 79 . Les diteurs ont finalement trouv le moyen de faire dialoguer les deux versions : en option, avec le Grand
75. 76.

De devenir des documents suivant un des axiomes noncs par RTP (voir supra). Lavenir permettra de se demander quel moment un texte devenu document perdra ce statut lorsquil ne sera plus disponible que pour les membres de quelques institutions qui auront sacrifi autre chose pour payer laccs ce document (RTP). 77. Dans Jean-Pierre Rioux et Jean-Franois Sirinelli (dir), La culture de masse en France de la Belle poque aujourdhui, Paris, Fayard, 2002. 78. Alors que le tout conomique implose rgulirement, comme lors de la rentre littraire 2004 o lun des principaux diteurs franais, Le Seuil-La Martinire, est rest absent plusieurs semaines des librairies pour des questions de distribution. 79. Suivant une volution dj ancienne des dictionnaires : avant larrive du cdrom, la seule diffrence entre les Robert 1 et 2 et le Grand Robert consistait dans la taille des caractres, des illustrations et des marges, plutt que dans le texte mme des articles : mme document, ou mme contenu ?

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 92/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Larousse illustr 2006, il est possible dutiliser un stylo multimdia pour cliquer sur des puces intgres dans le papier et ouvrir ainsi des documents multimdia complmentaires contenus dans un cdrom (films, bandes audio, cartes interactives) : le Grand Larousse cest donc un livre, un stylo et un cdrom. Les imprimeurs, les diteurs ont fait voluer lobjet livre, la modernit, la nouveaut pouvant bien entendu attirer le client. Rien de nouveau dans cette technique commerciale. Un exemple de ces mini-rvolutions qui maillent lhistoire du livre est celui de lAmadis de Gaule. Paris en 1540 apparat un livre nouveau : nouveau car le texte vient peine dtre traduit de lespagnol, nouveau aussi par la prsentation de limprim. Lcriture gothique traditionnellement utilise pour les textes de fiction en franais, hrite du temps du manuscrit, est enfin remplace par des caractres romains ; les gravures sur bois cent fois rutilises sont remplaces par de nouvelles vignettes, qui perdent elles aussi laspect gothique et sont graves spcialement. Le succs fut au rendez-vous pour ce livre comme pour les tomes suivants, et ldition fut suivie dune rdition plus petite, pour un public plus large 80 .
La nouveaut du monde

Nouveau peut tre le premier livre dun auteur, lide de nouveaut tant clairement annonce au titre. On le comprend dans certains domaines comme la gographie. Comment le jsuite Cristoval de Acua, son retour dun long voyage dexploration de deux ans, naurait-il pas appel son livre, publi Madrid en 1641, Nuevo descubrimiento del gran rio de las Amazonas ? Cette description est nouvelle , car elle navait jamais t faite avant 81 . Il y a des antcdents dans ce domaine particulier de lexploration gographique : en 1507 dj Montalbaddo Fracan avait publi les Paesi nuovamene retrovati, recueil de rcits de voyages effectus entre 1455 et 1502 82 . De nouveau retrouvs : le titre insiste lourdement sur la notion de nouveaut. Celle-ci vient du progrs humain, dont le livre est le tmoin autant que lobjet. Immdiatement rpercut par limprimerie, dans tous les domaines, mdecine, botanique, ou encore art militaire, le progrs dcrit dans les livres est lui aussi firement annonc au titre. Ce sont les sciences de la guerre que dsigne le sobre titre de Niccol Tartaglia, Nova Scientia, en 1537 83 . En 1609 Johann Kepler sort son Astronomia nova Heidelberg, vritablement nouvelle par les avances quelle propose 84 . La conjonction de plusieurs nouveauts apparat ici : limprimerie certes, mais aussi les dcouvertes gographiques, bientt la rvolution de lastronomie

80. 81.

Genevive Guilleminot, dans Antoine Coron (dir.), Des livres rares depuis linvention de limprimerie, op. cit., p. 112-113. Batrice Mair, ibid., p. 87-88. 82. Percy M. Muir, Printing and the Mind of Man, 2e d. rv. et augm. Munich, Karl Pressler, 1983, notice 42 p. 24-25. 83. Ibid., notice 66 p. 39-40. 84. Ibid., notice 112 p. 67-68.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 93/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Ces quelques exemples, fort varis, prouvent quel point la vie des uvres de lesprit crites a toujours t lie aux circonstances extrieures, les unes provoquant ou arrtant les autres (et vice-versa). cho de lvolution de la pense humaine, lcrit en pouse les nouveaux choix, les nouveaux intrts, les nouvelles modes, dans tous les domaines de la pense. En littrature, cest par exemple la querelle des Anciens et des Modernes, rgle par les diteurs au profit des Modernes 85 . Prenons lexemple de lhistoire, domaine qui sest renouvel plusieurs reprises, entranant la naissance de nouveaux types de documents, et par l mme la disparition des autres, jusqu ce quils deviennent eux-mmes objets dtude. Les Chroniques mdivales somptueusement imprimes au
XV
e

sicle, la grande priode des Fastes au


XIX
e

XVI

sicle, les grandes entreprises

ddition lances dans tout le pays au dbut du

sicle

86 e

: quelques exemples spectaculaires sicle, dont on peut imaginer quil

mais un mouvement continu et mme acclr la fin du

XX

sera sensible, non pas la gnralisation du numrique, mais la disparition de la forme papier. Lavenir de lessai historique reste crire, de mme que celui de la littrature , elle aussi sujette des mutations (profondes ?) et des renouvellements priodiques 87 . Le hasard, les malheurs jouent leur rle, crant la raret (voir plus loin) comme lors de la disparition en Mditerrane de la quasi-totalit du tirage de la bible polyglotte dAlcal de Henares. Les techniques actuelles vitent parfois ces malheurs : ainsi sort lautomne 2004 le 800e volume de la Collection des Universits de France, la double collection Bud (latine et grecque) des Belles Lettres entirement rdite lidentique aprs la destruction des stocks dans un incendie en 2002. Un seul de ces livres est nouveau, mais cest une nouvelle importante pour ldition franaise le rle des diteurs modernes dans toutes ces questions aurait mrit dtre trait aussi La situation nest sans doute pas la mme pour le document lre du numrique puisquil est lui-mme la nouveaut, et gnre une littrature bien plus importante que ne lavait fait linvention de limprimerie il y a cinq sicles. Le document studie lui-mme, cherchant sidentifier car il est dsormais multiforme 88 . Au-del de ce cas particulier, on pourrait prendre sans doute de nombreux exemples dinteraction de contingences extrieures dans les cycles de vie du document : renaissances (et lvolution rapide des standards dcide chaque fois des renaissances et
85. 86.

Wallace Kirsop, Les mcanismes ditoriaux , dans Histoire de ldition franaise, tome 2, op. cit. p. 20-33 (p. 21). Frdric Barbier, Une production multiplie , dans Histoire de ldition franaise, tome 3, op. cit., p. 112-113. 87. Christophe Charle, Le champ de la production littraire , ibid., p. 126-157. 88. Avec le risque de considrer comme acquis que le nouveau ne peut tre que meilleur. Lhumour peut tre un moyen de chercher user de mthodologie dans tous les domaines : Un visiteur de notre laboratoire dclarait que, si le livre avait t invent aprs lordinateur, il aurait constitu une avance majeure , Joseph Jacobson, inventeur de lencre lectronique, Le Monde, 22 juin 1999, cit par Pierre Le Loarer, Livres lectroniques : une nouvelle donne culturelle , p. 445-451, dans Alain Mercier (dir.), Les trois rvolutions du livre, op. cit. p. 445.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 94/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

des morts subites), mais aussi et peut-tre surtout lgislations et matrise de linformation (voir aussi les pages qui suivent). Lactualit nest-elle pas ces sommets internationaux, entre celui de Genve en 2003 et celui de Tunis de 2005, destins organiser une socit de linformation encore en gestation, signe defforts de dveloppement et de matrise de gouvernements ?
Tentatives pour matriser les textes et consquences
Rester matre du contenu : enjeux intellectuels et conomiques

Lauteur veut matriser ldition de son uvre, et lditeur veut empcher des ditions parallles qui lempcheraient de vendre ses exemplaires : le privilge est l pour les protger ds le
XVI
e

sicle. Il fixe un texte dans un domaine gographique si personne dautre ne peut limprimer,

personne dautre non plus ne peut le modifier mais il entrane paradoxalement le dveloppement dune industrie parallle : celle des contrefaons, dj florissante au XVIe sicle 89 . Le privilge a des limites gographiques, et on appelle contrefaons des ouvrages publis tout fait lgalement selon la lgislation en vigueur sur leur lieu de production, en dehors du territoire du privilge 90 : les libraires avignonnais, en terre pontificale, se firent une spcialit de rditions de livres rcemment imprims partir de la fin du
XVII
e

sicle puis au sicle suivant,

vendus moins chers puisquayant entran moins de frais 91 . On le voit, les problmes de lgislation applique au document, si vivaces aujourdhui sur Internet, ne sont, eux, pas nouveaux 92 . Autres cas que lon peut rapprocher de situations que lon connat lre du document numrique : les socits typographiques. Ces socits de distribution la plus connue est celle de Neuchtel, florissante la fin du
XVIII
e

sicle, dont les archives nous sont conserves distribuaient dans le royaume de

France ce qui tait illgal, et contrefaisaient les succs de vente 93 . Il peut tre fort ais de se procurer un texte encore indit, au temps de la plume doie comme aujourdhui. Sil est court et rapide imprimer, loccasion peut tre belle pour un diteur dobtenir un succs de vente par des moyens malhonntes. Molire a bien failli faire les frais dun tel procd, et ne la vit quen tombant dans un autre pige. En janvier 1660, il apprenait quun imprimeur stait procur une copie des Prcieuses ridicules, cre depuis quelques semaines seulement, stait fait accorder un privilge et sapprtait limprimer. Il neut dautre choix que de faire annuler le privilge pour le transfrer son informateur, le libraire Guillaume de Luynes,
89.

Annie Charon, Le monde de limprimerie humaniste , dans Histoire de ldition franaise, tome 1, op. cit., p. 237-253 (238). 90. Pour une dfinition de la contrefaon, voir Anne Sauvy, Livres contrefaits et livres interdits , ibid., tome 2, p. 104-110. 91. Ren Moulinas, La contrefaon avignonnaise , ibid., tome 2, p. 294-301. 92. Les livres prohibs taient eux aussi imprims en-dehors du territoire : des livres protestants par exemple. 93. Robert Darnton, Le livre prohib aux frontires : Neuchtel , ibid., tome 2, p. 343-359.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 95/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

afin dviter une nouvelle manuvre malhonnte. Imprime toute vitesse, sans doute par plusieurs imprimeurs en mme temps, cette premire dition existe sous un grand nombre dtats diffrents 94 . On peut penser quaujourdhui un diteur hsiterait utiliser un tel procd, mais de nombreux exemples, dans le domaine de ldition scientifique, de travaux indits ou publis dans une langue lointaine pills par des chercheurs parfois reconnus, montrent quil nen est rien (sans parler des romanciers). Il est peine plus rapide dditer un livret cr sous forme lectronique, sur papier ou non, quil ne ltait de composer ce mme texte sur une gale. La diffrence est peut-tre quun texte imprim est fix ; il est modifiable, falsifiable mais cette opration laisse des traces ; qui plus est, elle ne concerne quun exemplaire. Quant la contrefaon, elle ne cherche pas tre identique loriginal (sauf cas de tromperie que lon a cits). Il est peut-tre plus difficile de matriser un document numrique : rien de plus facile en effet que de modifier toutes les informations quil contient, y compris le nom de lauteur du document.
Crer la raret

Le document numrique, mme non imprim, est-il impermable lide de tirage limit ? Les motivations successives qui consistaient reconduire dans le partage du livre un sentiment dappartenance aristocratique forg dans le pralable partage de valeurs culturelles communes une troite socit , ou rserver des amis srs laudace dune pense , puis, plus tard, visaient crer la relation dlection [] qui, fonde dans lacte de la lecture, nexiste que par le livre lui-mme peuvent, on peut le penser, animer lauteur dun document encore aujourdhui. Forme, signe et relation : ces trois aspects de la bibliophilie dcrits par Antoine Coron se retrouvent en effet dans lapproche du document numrique choisie par le groupe RTP 95 . Ainsi il est dj courant, comme le faisait la Grande Mademoiselle en 1659 en imprimant 30 60 exemplaires les portraits dont elle avait lanc la mode, et qui taient distribus aux destinataires choisis, ou bien encore comme la premire partie du Manuscrit trouv Saragosse de Jean Potocki, publi cent exemplaires en 1804 Saint-Petersbourg 96 , dditer en un petit nombre dexemplaires un document lectronique sur support (cdrom, etc.), ou, comme le font dj les universitaires sur leurs forums de travail, dditer un document dont laccs est rserv aux lus dment inscrits 97 . Il sagit ici de livres volontairement condamns la raret, mais pas forcment une disparition rapide : on a pu observer en effet pour les poques prcdentes que ce sont des livres
94.

Jeanne Veyrin-Forrer, la recherche des Prcieuses , dans Eadem, La lettre et le texte : trente annes de recherches sur lhistoire du livre, op. cit., p. 339-366 (premire publication dans Bulletin du bibliophile, 1982, p. 287-320).Voir plus loin les questions dinstabilit du texte et dtats multiples dune dition. 95. Antoine Coron (dir.), Des livres rares depuis linvention de limprimerie, op. cit., p. 177. 96. Ibid. et p. 179. 97. Lapproche est diffrente lorsquun impratif conomique entre en jeu, et quand seul labonn jour de son abonnement a accs un document ou plus souvent un corpus de documents : les questions de contrle de diffusion cites plus haut ont t exacerbes avec le document numrique, contrl par les grands diteurs et impossible reproduire illicitement.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 96/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

imprims avec un gros tirage, mais destins un usage frquent (comme par exemple les ditions de livres dheures), dont il ne reste plus un seul exemplaire. Ldition en un petit nombre dexemplaires sur support fixe reste, elle, frquente, mme chez des diteurs officiels. Sans doute est-on encore dans une priode dvolution, o il nest pas facile de connatre la production disponible, mais aussi dans une priode damateurisme 98 , o lon voit des ditions petit tirage, mal ou pas distribues, de documents, cdroms ou dvdroms, souvent multimdia, et parfois de bonne qualit : destins rester confidentiels et ignors mme de ceux qui pourraient tre intresss par leur contenu. Ds lorigine, une vie brve et cache, dautant plus brve quon en aura copi et pas press le contenu sur des disques non destins larchivage, attend ces documents numriques. Cette tude ne sarrte pas au document rest manuscrit, qui nest pas arriv jusqu limprimerie pour des raisons varies 99 : aujourdhui, une partie de ce type de documents finit dite, par leur auteur en gnral, sur un site personnel la dure de vie particulirement fragile. On pourrait linverse sarrter aussi la question de la raret rendue encore plus rare travers les choix de conservation des bibliothques et les crations de rserves depuis un peu plus de deux sicles. Une partie de ces livres dj rares lest car ils nont pas t estims, et paradoxalement ils en deviennent prcieux 100 : la question de valeur dun document, pour lequel on peut juger quil est digne dtre conserv pour lavenir, et de bnficier de techniques de conservation parfois lourdes (voir infra) est sans doute lier aux questions poses aujourdhui propos du document numrique : quels livres anciens numriser, quels documents numriques transfrer et adapter ? Malgr tout, on imagine encore mal comment pourrait se crer lquivalent de la bibliophilie la plus fine, celle qui recherche toujours le livre unique 101 , celle-ci tant gnralement lie aux supports : papier, caractres, reliure, provenance.

98.

Qui nest pas sans rappeler les dbuts hroques de la micro-informatique grand public, quand lapprentissage de son utilisation passait par celui de la programmation basique. 99. Wallace Kirsop, Les mcanismes ditoriaux , dans Histoire de ldition franaise, tome 2, op. cit. p. 22. 100. Jeanne Veyrin-Forrer, Les rserves (livres imprims) , dans Eadem, La lettre et le texte : trente annes de recherches sur lhistoire du livre, op. cit., p. 368-392 (premire publication dans Conservation et mise en valeur des fonds anciens rares et prcieux des bibliothques franaises, Villeurbanne, Presses de lcole nationale suprieure de bibliothcaires, 1983, p. 65-82). 101. Michel Melot, dans Alain Mercier, Les trois rvolutions du livre, op. cit., p. 408.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 97/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Linstabilit du texte comme caractristique intrinsque du document travers les rvolutions ? Leffort des hommes pour corriger le texte quils produisent, tendant vers une impossible perfection, et la volont de mise jour du document ont-ils connu des modifications grce lapport des techniques ? Aprs le manuscrit sur lequel les rudits dAlexandrie dj utilisaient des marques spciales pour indiquer les types de correction apporter , ces ambitions sous-tendent la fabrication du livre, bien que parfois contraris par des impratifs techniques ou conomiques.
Les multiples formes du mme texte

Jeanne Veyrin-Forrer a trs bien dcrit en 1982 les tapes de la fabrication dun livre au
XVI
e

sicle, conduisant lexistence de plusieurs tats dun mme livre : un document, donc,
la copie, exemplaire utilis par le prote : manuscrit ancien ou texte nouveau, transcription par un copiste professionnel, dition imprime prcdente reprise et corrige, parfois trs enrichie La copie peut tre dj une transcription par un copiste professionnel, lcriture plus lisible, du texte donn par lauteur, lditeur scientifique ; la feuille compose par le typographe ; les preuves : elles sont tires au fur et mesure que les formes sont imposes, avant que ne se lance limpression ; une seconde preuve, aprs intervention du compositeur qui remplace les caractres changer, est thoriquement destine lauteur ou lditeur ; les tats : il arrive que des erreurs soient dtectes au moment mme o les premires feuilles viennent dtre imprimes sur une forme. Le fait peut se rpter plusieurs fois au cours de limpression, soit que le pressier ou le correcteur dcouvre une nouvelle erreur, soit que lauteur survenant limproviste impose une modification. Le pressier peut tout moment interrompre le tirage et donner la forme corriger . En fin dimpression, limprimeur peut aussi dcider de faire recomposer et rimprimer une feuille entire en remplacement de la feuille fautive . En ralit, pour des raisons dconomie, cest souvent un seul ou quelques feuillets qui sont ainsi rimprims. Le ou les feuillets primitifs supprimer seront coups par le relieur et les feuillets de substitution, dits cartons, colls ou insrs leur place . Dautres corrections sont encore possibles : on peut encore faire repasser chaque feuille sous la presse, imprimer quelques lettres

toujours le mme officiellement mais toujours diffrent 102 :

102.

Jeanne Veyrin-Forrer, Fabriquer un livre au XVIe sicle , dans Histoire de ldition franaise, tome 1, p. 279-301 ; voir aussi Jacques Rychner, Le travail de latelier , ibid., tome 2, p. 42-61.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 98/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

et coller un bout de papier imprim sur la faute, ou bien encore, surtout au XVe sicle mais on en voit encore des exemples au XVIe sicle, corriger la main chaque exemplaire.

Ainsi pour un mme document, les diffrents tats sont aussi compliqus classer que cela peut-tre le cas pour des documents informatiques mal nomms et mal classs 103 , et ce tout au long de la priode du livre artisanal. Le De linterprtation de la nature de Denis Diderot est publi en 1753 sans nom de lieu Paris : un premier tat est corrig et augment de nombreux cartons ; le second tat est mis en vente en 1754 mais sous un nouveau titre, Penses sur linterprtation de la nature 104 : au total, plusieurs combinaisons diffrentes pour un mme texte (figures 4 et 5) 105 .

103.

Sur un disque dur comme sur un site (cest--dire sur un disque dur en rseau) : ainsi en est-il, paradoxalement, de RTP 2003, dont la dernire version est difficile diffrencier des autres. 104. Batrice Mair, dans Antoine Coron (dir.), Des livres rares depuis linvention de limprimerie, op. cit., p. 219. 105. On voit ici un nouvel exemple de lutilisation de la page de titre pour vendre du vieux pour du neuf, nouveau avec une diffrence dune seule anne mais avec une modification beaucoup plus importante que la date : le titre lui-mme. Voir supra.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 99/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Figure 4. Diderot, Denis, Penses sur linterprtation de la nature. [Londres ?] : s.n., 1754. Bibliothque Mjanes (Aix-en-Provence). D 7607. Page de titre. Figure 5. Diderot, Denis, Penses sur linterprtation de la nature. [Londres ?] : s.n., 1754. Bibliothque Mjanes (Aix-en-Provence). D 7607. Page [3]. Clichs CCL-Cit du Livre Ville dAix-en-Provence. Droits rservs.

la longue liste des diffrentes versions dun mme document (on suit ici une des dfinitions donnes par le groupe RTP), on ajoute lpoque contemporaine ldition proriginale : La condition humaine dAndr Malraux par exemple, publie dans la Nouvelle revue franaise en 1933. Malraux corrigea encore plusieurs fois le texte avant ldition originale du 5 mai 1933 : il donna un manuscrit lditeur puis corrigea la dactylographie, les deux sries dpreuves de la prpublication dans la NRF, puis celles de la premire dition. Le manuscrit fut corrig lui aussi 106 . Procdant dune dmarche diffrente, les corrections apportes par Saint-John
106.

Antoine Coron, dans Id., Des livres rares depuis linvention de limprimerie, op. cit., p. 214.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 100/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Perse tous les documents le concernant, sa correspondance, cherchent, par la matrise de tous ceux de ses mots quil destinait la postrit, matriser compltement son image. Contrlant luimme ldition de ses uvres dans la Pliade, il fixa dans le marbre ou plutt dans un fragile papier bible le souvenir quil souhaitait laisser, dans les moindres dtails. Les textes ne sont pas davantage corrigs depuis quils sont transmis et relus sous forme numrique autant quimprime. La grande diffrence est que les versions lectroniques successives disparaissent et que la tche des spcialistes de la gense des textes est complique par larrive du numrique : les versions successives, sans doute, disparaissent au profit de la dernire, celle qui est dite sous quelque forme que ce soit 107 . Si lon compare avec la fabrication dun livre lpoque du numrique, que peut-on remarquer ? Si dans lidal lauteur confie un document numrique lditeur, qui le relit, le corrige et le donne limprimeur qui na pas besoin dintervenir directement sur le texte, les auteurs habitus relire des premires preuves savent que cest rarement le cas : on y trouve souvent des erreurs qui ne peuvent sexpliquer que si le texte a t recompos, pour employer un terme venu de limprimerie artisanale, ou ressaisi : cela arrive mme de plus en plus souvent lorsque limprimeur prend possession dun texte trop compliqu , c'est--dire avec des mises en page, des hirarchisations cres par un logiciel qui nest pas compatible avec les logiciels de PAO : on a ainsi lhabitude de relire attentivement les tableaux, par exemple. Sortir du banal est aussi synonyme de difficults : insrez une citation grecque dans un texte en caractres latins, et limprimeur na dautre choix que de ressaisir votre citation, car il ny a pas de polices universelles reconnues par les systmes dexploitation et les logiciels les plus frquents ; en recopiant pourtant le tirage imprim que vous lui avez fourni, il a introduit nombre derreurs, qui seront diffrentes mais toujours prsentes dans les secondes preuves et sans doute encore dans ldition. Les imprimeurs du
XV
e

sicle ont trouv trs tt (1460) le moyen dinsrer des caractres


XXI
e

grecs dans un document, mais il nen est pas de mme pour ceux du

sicle, malgr leurs

logiciels ultra-puissants. La question de savoir si le prote doit comprendre ce quil crit reste donc pose, les deux rvolutions du livre qui ont suivi celle de 1450 ny ont rien chang.
107.

Ce nest pas le lieu ici daborder les questions de gense dun texte avant que lauteur ne donne son manuscrit lditeur et aux modifications apportes par linformatique dans cette gense et dans les traces de la cration laisses aux chercheurs. Par ailleurs je nai pas regard de prs les habitudes dans le domaine des sciences exactes, et des prpublications prcdant la publication officielle sous forme lectronique. Sur les tapes de la cration dun document depuis lorigine jusqu limpression dun livre, voir, sur le mode humoristique mais plein denseignements, Christian Jacob et Jean-Marc Chatelain, Avant-propos , dans Henri-Jean Martin, Les mtamorphoses du livre : entretiens avec Jean-Marc Chatelain et Christian Jacob, Paris, Albin Michel, 2004, coll. Itinraires du savoir .

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 101/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Les tats en revanche nont plus de raison dexister. Les machines qui impriment grande vitesse les livres ne laissent pas la possibilit de relire et de corriger : il y a donc moins de chance quune dition prsente plusieurs tats diffrents : le numrique ici, a entran lexistence ou la possibilit de moins dtats diffrents dune mme dition : le document devient alors moins instable quil ntait auparavant.
Des contre-exemples : avances technologiques et progrs commerciaux

lpoque dune acclration des progrs, la fin du

XVIII

sicle, une invention, dans le

domaine de limprimerie, contribua fixer le document quelle servait composer : la strotypie 108 . Invente en 1797, la strotypie fut lorigine des procds de clichage typographique , tous procds qui eux aussi, fixrent momentanment le document jusqu ce que de nouveaux procds techniques permettent de le rendre nouveau modifiable. Elle prend pour base lutilisation des caractres mobiles, partir desquels est moul un bloc dun seul morceau, appel clich, suivant des procds plusieurs fois amliors jusquau brevet dpos en 1797 par Firmin Didot. Ce procd, particulirement conomique 109 , fut accompagn dune utilisation commerciale immdiate : ldition des principaux classiques franais et trangers , un moindre prix, promis exempts de fautes. Plus audacieux encore : Didot et son associ vendent les blocs leurs confrres. Dprci par Stendhal et Balzac qui cre au dbut des annes 1830 ladjectif strotyp , le procd a linconvnient de fixer dans le marbre les erreurs et de rendre clbres, trouve Stendhal, des auteurs qui nont aucune raison de ltre : trange anticipation de propos daujourdhui 110 Lvolution du procd, annonciatrice du flan , ne permet pas la strotypie de rsister aux techniques modernes de clichage. Elle reste pourtant utile dans un domaine o la correction ne peut tre prvue, faute de temps : celui de la presse quotidienne, qui lutilisa avec les cylindres des rotatives de la fin des annes 1850 aux annes 1970. Elle disparat en mme temps que les rotatives cylindre sont remplaces par loffset. Toutefois les techniques de clichage, qui fixent le texte dfinitivement, sans possibilit de correction ( moins de refaire le tout) continuent tre dveloppes la suite de la strotypie : la galvanoplastie, puis la plastotypie 111 . Une autre invention fixa le texte : la Linotype, associe une invention rvolutionnaire qui conditionne encore aujourdhui nos mthodes de travail : celle du clavier utilis pour slectionner le
108. 109.

Alain Nave, La strotypie, entre innovation technique et produit ditorial , dans Alain Mercier, op. cit., p. 283-288. Il vite limmobilisation de caractres sur une forme en attendant un retirage, le tirage alatoire de nombreux exemplaires dont la vente pourra stendre sur dix ans, et lusure des caractres, plus rapide au fur et mesure que les presses se mcanisent. 110. Cest ce quil crit en 1825 propos du Cours de littrature de La Harpe, ce critique born (Alain Nave, op. cit., p. 287). 111. Alain Mercier, Le livre laube de lindustrialisation , Les trois rvolutions du livre, op. cit., p. 357-359.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 102/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

texte composer 112 . La Linotype permet de slectionner directement des matrices, partir desquelles est fondu le bloc 113 . Invente en 1884, elle est le rsultat de longues annes de recherches techniques. Mais lanne suivante est invite la Monotype, qui sur le mme principe, moule les caractres un par un 114 . Sil tait sans doute difficile de corriger en cours dimpression, on voit que les innovations techniques ne vont pas toutes dans le sens du monobloc fig 115 . Des procds permettant limpression plus rapide et moindre frais ont entran la fixation dfinitive du texte, sauf le recomposer. Mais ces exceptions prs, on saperoit que depuis Gutenberg (ou quel que soit le vritable inventeur de limprimerie en caractres mobiles) les hommes ont toujours cherch crer et perfectionner des techniques ddition permettant le plus possible la correction, comme cest le cas aujourdhui.
Une volution : la mise jour a posteriori dun document

Les organisateurs de cette runion proposaient en creux comme sujet dtude, cit au sein de ceux qui navaient pas retenu lattention des historiens du livre, la notion de rafrachissement . Cette notion est difficile saisir dans le domaine du livre. Doit-on lassimiler celle ddition, zone bien connue de la notice ISBD, dont on a vu quelle connat bien plus de subtilits que la simple mention d. corr. ? Se garder la possibilit de corriger un texte peut avoir plusieurs objectifs : chercher la perfection ; chercher donner une information jour. Les deux peuvent se rejoindre, mais concernent habituellement des types de textes diffrents, essentiellement ce que lon appelle en bibliothque fiction et documentaire mme si ldition scientifique des uvres de fiction est sensible la notion de mise jour. Les responsables dun document, auteur, diteur, imprimeur, recherchent la perfection. Les recherches techniques dans le domaine ont presque toujours tendu trouver le moyen datteindre cette perfection en permettant la correction, lide sous-tendant ces recherches tant finalement qu un texte est toujours plus ou moins fautif dans sa lettre 116 .

112.

Le clavier apparat en 1822 : Alain Mercier, Bouleversements mcaniques dans la seconde moiti du XIXe sicle , ibid., p. 396-399 (397). 113. Frdric Barbier, Lindustrialisation des techniques , dans Histoire de ldition franaise, tome 3, op. cit., p. 56-67.
114. 115.

Ibid. Mme si avec la linotype, pour corriger il faut recomposer seulement la ligne entire. 116. Roger Laufer, Avant-propos , dans La bibliographie matrielle, op. cit., p. 7. Laufer sintresse ici au document sous sa forme de livre imprim.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 103/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Le rafrachissement ncessaire dun texte documentaire est facilit par lutilisation du numrique dans la conception des textes, quils soient destins tre publis sur papier ou non. On en prendra comme exemple trs rcent la dernire dition du Mtier de bibliothcaire, sorti en octobre 2003 117 . La rimpression davril 2004 a t loccasion de corriger des erreurs typographiques, mais aussi de tenir compte des avis reus, enlever certaines choses et en rajouter dautres ; elle a permis surtout de mettre jour une partie rendue caduque par lvolution de la lgislation : trois pages ont ainsi t intgralement modifies. Cette mise jour a concern plusieurs dizaines de corrections (lditeur demandait simplement que la mise en page ne ft pas change, sans donner de limites au nombre de modifications) et pourtant rien dans la prsentation de louvrage nindique quil nest pas tout fait le mme que la premire impression : la couverture, la page de titre, le copyright sont strictement identiques ; seul lachev dimprim bien sr est diffrent. On peut toutefois relever une volution nouvelle : pour permettre aux possesseurs de la premire dition de mettre jour leur exemplaire, larticle entirement modifi est disponible dans un numro de la revue BIBLIO(thques). Dautres sans doute au cours de ce colloque sarrteront cette autre ide (reue ?) consistant considrer que tout document prsent sur le world wide web est par nature volatile : il faut sans aucun doute nuancer cette affirmation : on peut mettre en parallle un document souvent mis jour avec les nombreuses modifications que peut connatre depuis toujours le document imprim, que ce soit laide du caractre mobile ou des donnes numriques. Pour la fragilit de survie, l aussi on peut sans doute nuancer : au vu du pass mme rcent, on peut imaginer que certains documents lectroniques sont destins une longue survie, au prix des volutions techniques ncessaires (il faudra en effet que ces documents restent consultables et utilisables quelle que soit lvolution des systmes dexploitation utiliss par le grand public) : les grands catalogues de bibliothques, les grands corpus de textes cits plus haut, les priodiques prennes, les encyclopdies les plus clbres 118 Volatile peut-tre pas, mais instable, davantage penserait-on que le document imprim. Les modifications dun document numrique peuvent en effet intresser plusieurs aspects, et pas uniquement le format ou la prsentation. Lvolution des moteurs de recherche associs tel document lectronique de grande taille est importante 119 . Ainsi les ditions successives des
117.

Sur ce document multiforme dont finalement le nom seul ne change pas, voir la contribution dA.-M. Bertrand dans le cadre de ce colloque. 118. Mme si on notera le retour la forme papier de lEncyclopdia universalis, signe du rle fondamental, peine abord ici, du lecteur ( dfaut dun autre terme) cibl par un document, quelle que soit sa forme ddition. 119. Davantage sans doute que lvolution graphique, dont on peut suivre la mode en France sur des sites institutionnels et des sites de bibliothques publiques : ces dernires annes, les couleurs fonces ont laiss la place une prdominance du blanc et du graphisme simple. Voir Raphale Mouren Quel graphisme pour le site web ? , Bulletin des bibliothques de France, [en ligne] <http://bbf.enssib.fr> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 104/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Signets de la BNF (dont la mention ddition est toujours mise jour) ont-elles parfois concern des donnes, une mise jour dinformations dont certaines sont par nature phmres, mais dautres fois cest le logiciel utilis pour y faire des recherches qui a t modifi 120 . Quen tait-il aux sicles prcdents ? Comme aujourdhui, un grand nombre de textes chappaient cette notion de mise jour : uvres de fiction, littrature de pit Pour le reste de la production, la mention ddition mise jour , enrichie prend une ampleur considrable ds le
XVI
e

sicle Et mme lorsque rien nindiquait une mise jour ou une correction du livre, les

diteurs le firent naturellement. Ratdolt, linventeur de la page de titre au XVe sicle, quand il faisait une rdition, la corrigeait ou la remaniait toujours : le document ntait pas fix, une nouvelle dition tait loccasion de lamliorer 121 .
Assurer la survie

Derrire le titre de ce colloque se cache peut-tre un travail mener sur la conservation. L aussi, une sparation parfois inconsciente des supports prime. Un document officiel franais rcent sur la conservation est un plan daction pour le patrimoine crit , cest--dire (aprs tout le titre ne le prcise pas), le livre tel quon le connat, le codex crit ou plutt imprim (la diffrence est grande dans le domaine du signalement). Pourtant, la rflexion sur la conservation des documents devra tre globale, comprendre les textes quelle que soit leur forme. Elle sera mene par les bibliothcaires, les archivistes, les techniciens spcialiss (biologistes, chimistes, informaticiens). Cest la question de la dure totale de vie. Le document programmatique de ce colloque parlait des formes nouvelles sous lesquelles les documents imprims traversent le temps : le manuscrit crit sur parchemin traversera encore bien des sicles, sous la mme forme ( lexception peut-tre de sa reliure, qui a pu tre remplace plusieurs reprises) ; le livre imprim sur papier de chiffon, sil na pas t imprim avec une encre trop acide, aussi ; le livre imprim sur papier de pte de bois est dune extrme fragilit, mme dsacidifi. Quen est-il du livre imprim numris, devenu document numrique, de son support la dure de vie rduite (le disque de verre semble en voie de disparition, et rien ne garantit sa dure de vie et encore moins celle de son contenu ; on connat bien des morts violentes et soudaines de disques durs, de bandes magntiques), des logiciels ncessaires sa consultation, la dure de vie encore plus rduite de mme que les systmes dexploitation associs et mme les machines adaptes Quelques tablissements feront dnormes efforts financiers et techniques pour conserver ces documents numriques disponibles, en France, la
120. 121.

<http://www.bnf.fr>. Christoph Reske, De Venise Augsbourg : Erhard Ratdolt, un imprimeur dexception , dans Alain Mercier, dir., Les trois rvolutions du livre, op. cit., p. 189-191.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 105/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Bibliothque nationale de France en premier lieu, mais quen sera-t-il de tout ce qui ny est pas dpos, de tout ce qui ny est pas considr comme prioritaire ? Dans cent ans les historiens travaillant sur lpoque mdivale et moderne disposeront toujours de leurs sources (sauf si celles-ci sont victimes de leurs multiples ennemis), mais si la mesure a sans doute t bien prise par les chercheurs spcialiss des efforts faire pour assurer la vie la survie des documents numriques, les grandes firmes spcialises dans les outils destination du grand public jettent un grand silence sur le sujet, et promettent la vie ternelle nos photos numriques. Or les outils de lhistoire nont pas toujours t conus comme tels : est-ce que dans cent ans les historiens nauront plus comme sources que les documents dment estampills comme tels ds leur cration ou peu de temps aprs ? Imaginer que le document produit depuis le milieu du
XIX
e

sicle traversera le

temps , quil soit manuscrit, imprim, numrique, audiovisuel, semble pour linstant dcouler dun optimisme suicidaire. Les grands programmes vertueux seront impuissants assurer cette survie 122 .

Conclusion Henri-Jean Martin a rappel dernirement que le livre [] demeure [] objet symbolique par excellence et vise parfois encore lutopie du chef-duvre (). Sera-t-il rduit au rang dutilit, ct des mass media qui atteignent les foules et rapportent des bnfices plus fructueux ? , se demande-t-il 123 . Au mme moment, Michel Melot insiste lui aussi sur cette dimension symbolique :
Parmi tous les objets de savoir, le livre jouit dun statut dexception que na ni le journal, quon jette aprs lavoir lu, ni la bande magntique, ni la pellicule du film, ni le disque dur ou la disquette. Le livre nest pas trait comme un simple support, un vhicule ou un instrument doptique. Sa forme mme lui confre une place particulire, intermdiaire entre lobjet utilitaire et lobjet dart ou de culte. Le livre est demeur, dans nos vies profanes, un objet liturgique, ce quil fut ds ses origines. La parole divine qui y fut inscrite a imprgn ses pages : il en reste des traces, si faibles soientelles, dans tous ses exemplaires, mme les plus vils
124

122.

Ainsi dans lappel projet dj cit de ce colloque : La conservation, quant elle, doit intgrer cette notion de cycle de vie, diffrent selon les types de document, de faon ne pas mener une guerre tous azimuths [sic], perdue d'avance, contre les forces de destruction, mais adapte la nature propre de chaque document, dont la dure de vie est en quelque sorte inscrite dans son code gntique . 123. Henri-Jean Martin, Prface , dans Dictionnaire encyclopdique du livre, op. cit., p. XXVI. Le second volume du Dictionnaire encyclopdique du livre, contenant un article livre rdig par H.-J. Martin, est sorti aprs la rdaction de ce travail : on sy reportera pour prolonger la rflexion. 124 Michel Melot, Le livre unique, de la religion du livre lidologie du livre , dans Alain Mercier, dir., Les trois rvolutions du livre, op. cit., p. 406-412 (407).

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 106/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Ces phrases entranent plutt la question inverse de celle que se pose Henri-Jean Martin : le livre est-il destin passer de lusage au trsor comme avant lui les manuscrits prcieux 125 ? Ces questions ne sont pas lobjet de ce travail, mais plus modestement il sagit de montrer que les supports de conservation et de communication de linformation ont connu de multiples modifications, rvolutions dit-on souvent propos du livre, sans quil soit toujours possible de voir lapparition soudaine de profondes mutations , ni transformations radicales pour employer des expressions employes parfois un peu vite. Digital is not different , rpte aujourdhui lenvie lInternational Federation of Library Associations (Ifla), sappuyant sur les dcisions du congrs de l'Organisation mondiale de la proprit intellectuelle (OMPI/Wipo) de 1996. Elle travaille aujourdhui lide de bibliothque hybride, plutt qu celle dune bibliothque sans supports visibles autres que les terminaux informatiques, comme celle que vient douvrir grands frais la ville de Milan (presque sept millions deuros !), que lon opposerait la bibliothque des documents. Ces questions, ces points de vue rendent ncessaire, sans conteste, une rflexion pistmologique propos de la transformation contemporaine du livre , du texte , ou du document , de la ressource pour employer les termes du WWW 126 . Cette rflexion ne devrait-elle pas tre mene de conserve par les chercheurs des disciplines concernes (sans oublier les historiens, premiers avoir dvelopp des mthodologies prcises fondes sur ltude et lemploi de lcrit), en vitant la fois les sparations chronologiques traditionnelles et les sparations par support dont nos bibliothques publiques sont dsormais revenues ? Elle suppose la collaboration de spcialistes de nombreux domaines, qui pour linstant semblent spars en groupes impermables 127 .
125

Pour reprendre le titre dune exposition propose en 2002 par la Bibliothque municipale de Lyon : Manuscrits mdivaux : de lusage au trsor, Lyon, 21 septembre [2002]-4 janvier 2003 : catalogue publi sous le mme titre, dir. Pierre Guinard, Lyon, Bibliothque municipale de Lyon La Part-Dieu, 2002 (Collection (Re)dcouverte ). 126. Roger Laufer, La bibliographie matrielle : pourquoi faire ? , dans La bibliographie matrielle, op. cit., p. 15 ; RTP 2003. 127. Leffort, saluer, de RTP pour runir spcialistes dhorizons varis, tombe malheureusement dans deux de ces piges : se spcialiser dans un support (ou plutt liminer un support de sa rflexion), et ignorer lexistence de tout un pan de la recherche. Cest malgr tout dans ce sens quil faut avancer et ce groupe dj form pourrait servir de dpart des recherches plus globales sur le sujet.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 107/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Partie 4 - Le traitement documentaire

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 108/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Les traitements documentaires automatiques et le passage du temps


Lyne DA SYLVA cole de bibliothconomie et des sciences de linformation Universit de Montral
Rsum : Dans cet article, nous examinons le sort des documents qui ne sont pas destins vivre longtemps et qui ne mritent ainsi aucun traitement documentaire traditionnel. Nous dfendrons la thse que les traitements automatiques, bien que produisant des rsultats de moindre qualit que les traitements humains, ont leur place pour le traitement de certains documents phmres. Ils doivent cependant rpondre des normes de qualit quil faut dfinir de nouveau dans le contexte numrique.

Traitement documentaire : contexte et dfinitions Pour parler de traitement documentaire, nous retiendrons ici le contexte dun service dinformation qui dessert une collectivit dutilisateurs dans leurs besoins dinformation, spcifiquement de ressources dinformations consignes ; bien sr, tant donn la thse prsente ici, le support numrique est celui qui nous intresse particulirement. Ce service dinformation peut tre traditionnel (bibliothque, centre de documentation ou darchives, etc.) ou non. Notamment, un contexte qui sera repris au cours de ce travail est le rseau Internet, qui donne accs maintenant un nombre important de documents divers. Dans ce cas, le service dinformation est incarn par larchitecture mise en place par les outils que sont les moteurs de recherche ou les annuaires, ou encore les bases de donnes textuelles ou documentaires labores par un organisme. La collectivit dutilisateurs pourra couvrir lensemble des internautes ou tre limite aux gens autoriss consulter la base de donnes documentaires. Les traitements automatiques qui nous intressent portent essentiellement sur des versions numriques de lanalyse documentaire. Ceux qui viennent le plus facilement lesprit sont les applications dindexation automatique ou de rsum automatique. Mais ds que lon a accs une version numrique dun texte, dautres deviennent possibles.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 109/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Exigences des traitements traditionnels La notion de cycle de vie dun document est cruciale pour plusieurs aspects de la gestion documentaire. Un service dinformation y est trs sensible. Notamment, la prennit que lon reconnat aux documents qui entrent dans la chane documentaire entrane des attentes : pour ces documents jugs prcieux, les utilisateurs potentiels exigent, de la part du service, un traitement la hauteur de leur valeur. Ainsi, le traitement documentaire traditionnel doit rencontrer un certain nombre dexigences de qualits, garantes auprs de leurs utilisateurs de la fiabilit du service dinformation. Les exigences de qualits portent non seulement sur la slection et la prservation des documents, mais aussi sur lanalyse documentaire, la production de reprsentations fidles des documents et le mode daccs ceux-ci. Parmi les exigences, on relvera celles qui suivent ; elles seront reprises dans lexamen des performances des systmes automatiques. La normalisation : celle-ci est la premire tape vers la garantie de qualit. Les normes (Afnor, 1990, 1993, par exemple) portent la fois sur la mthodologie applique et sur les produits rsultants. Lexistence de normes publies encadrant lactivit de lanalyse documentaire permet dassurer la qualit et linteroprabilit des systmes et lchange des informations. La mise au point de politiques et procdures : afin de prciser le flou laiss dans les normes nationales et internationales (flou ncessaire, pour permettre leur application dans diffrentes situations), un service se doit de mettre au point des politiques et des procdures contextualises selon les genres de documents et les profils de ses utilisateurs. Lvaluation et la validation : ltablissement de processus de validation et dvaluation des produits a pour but de vrifier que les procdures sont appliques adquatement et ralisent le mandat du service dinformation. La rigueur et la cohrence : seules ces dernires peuvent assurer dobtenir les mmes rsultats entre indexeurs et dans le temps. De cette cohrence dcoule la possibilit pour les utilisateurs de retrouver leur tour les documents qui les intressent. Bien sr, on connat les difficults poses par ces exigences. Nombre dtudes attestent de la relativement faible cohrence entre indexeurs (Leininger, 2000) ou entre rdacteurs de rsums (Schlesinger et alii, 2003). Le dtail atteint par certaines politiques danalyse documentaire a prcisment pour but de rduire les possibilits dinterprtations personnelles menant aux incohrences. Les mesures dvaluation et de validation tentent de contrler la qualit des rsultats. Bref, la rigueur et la cohrence sont des objectifs dclars et poursuivis, qui sont nanmoins difficiles atteindre. On verra dans la suite la diffrence qui oppose, ce chapitre, les traitements humains aux traitements automatiques.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 110/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Lexactitude et la fidlit : la reprsentation des documents doit, bien sr, tre fidle linformation contenue dans ceux-ci. Cette exigence devrait tre la premire ; mais dans lenseignement de lanalyse documentaire, on souligne que lexactitude doit tre atteinte dans le respect des normes, des politiques, des procdures ; elle en serait donc une consquence naturelle. Lanalyse documentaire humaine est particulirement russie quant ces aspects. Cela dcoule notamment de la capacit quont les analystes de rellement saisir le sens, le contenu des documents. Mais encore : pour mener bien la tche danalyse documentaire, une bonne connaissance des caractristiques des documents contenus dans la collection constitue lun des deux points de dpart pour une description russie ; le deuxime rside dans une aussi bonne connaissance des utilisateurs, leurs profils, leur niveau dexpertise, leurs habitudes de travail et de recherche dinformation. En vrit, ces deux considrations sont les piliers de toute lentreprise.

Le paradoxe des traitements automatiques Comment se positionnent les traitements automatiques par rapport ces exigences ? Plutt mal, il faut le dire. Normes, procdures et valuation : le dveloppement des produits se droule gnralement de faon ad hoc, cest--dire en respectant ventuellement des mthodologies de dveloppement informatiques, mais pas les mthodologies danalyse documentaire. De surcrot, les projets sont habituellement pilots par des informaticiens, sans recours aux bibliothcaires, documentalistes ou archivistes. La notion de normes portant sur la description et la gestion documentaire est absente (dans sa presque totalit) de la conception de systmes informatiques documentaires. Les crits sur les normes dindexation dans le contexte numrique proviennent plutt de la discipline des sciences de linformation que de linformatique (voir par exemple Anderson, 1994 ; MacDougall, 2000). En consquence, il est difficile de faire une valuation utile des systmes, puisquil nest pas facile de contrler ce que lon value. Et pourtant, on observe depuis une dizaine dannes un essor dans lvaluation des systmes automatiques de traitement de la langue : les confrencescomptitions TREC et MUC (pertinentes pour lindexation automatique) (Harman, 1995, 1996 ; MUC, 1995, 1998) et DUC (pour la condensation automatique) (Over, 2002), etc. Les normes dvaluation se limitent aux rsultats attendus, que lon compare (faute dautre moyen automatique) des rsultats produits par les humains pour les mmes tches. Exactitude et fidlit : les systmes automatiques en sont encore perfectionner les traitements afin de saisir le sens des noncs contenus dans les documents. La difficult principale rside dans le fait que les systmes ne dpassent gnralement pas le traitement des chanes de

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 111/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

caractres (des formes de surface) du texte ; la comprhension du sens est lobjectif poursuivi par les travaux en smantique computationnelle (voir Lappin, 2003), mais demeure un idal lointain. De faon plus inquitante, les systmes sont souvent rigides quant aux genres de documents traits. Par exemple, bon nombre de systmes exprimentaux de condensation automatique sont spcialiss dans le rsum darticles scientifiques (voir notamment Saggion et Lapalme, 2000, 2002) et ne peuvent rsumer adquatement un autre genre, les articles de journaux par exemple. galement, les besoins des utilisateurs sont mal connus et peu incorpors. En fait, si lon considre les logiciels grand public, les utilisateurs viss sont mal dfinis. Les travaux de recherche portant sur les utilisateurs sintressent gnralement leur comportement observable daprs des journaux dexcution ou de navigation (par exemple, Cooley et alii, 2000 ; El-Ramley et Stroulia, 2004), mais nabordent pas vraiment la question de leurs motivations, leurs besoins ou leur niveau dexpertise du domaine. Leur niveau dexpertise en recherche dinformation est parfois pris en compte ; il est capt par les diffrents niveaux de recherches : simple, avance, experte. On constate cependant un paradoxe : les applications informatiques connaissent un succs, une popularit incontestable, que lon ne peut expliquer que par leur utilit vidente. Il est clair que les critres de succs ne sont pas dfinis selon le respect des normes et des procdures, mais daprs la russite de tches prcises, quantifiables et faciles mesurer. Nous le verrons, les avantages des traitements automatiques se situent donc lextrieur de la liste de critres que nous avons examins jusqu prsent.

Traitements automatiques pour documents phmres Le moteur de dveloppement des solutions informatiques est donc principalement pragmatique et utilitaire. La croissance phnomnale des collections numriques rend les traitements automatiques incontournables, en particulier dans lexploitation du Web. On observe ainsi une frnsie dans les champs de recherche associs : recherche dinformations (ou reprage dinformations), gestion de contenu , gestion de la connaissance, condensation automatique, etc. Mais dun point de vue thorique, peut-on lgitimer ces travaux, lors mme que les utilisateurs experts (issus des sciences de linformation) dplorent la pitre qualit de leurs performances ? Il est un cercle dactivits o les approches automatiques sont ingales par les traitements documentaires traditionnels : le traitement de documents vous la disparition. On parle ici de documents qui chappent entirement la chane documentaire ; ils peuvent y chapper parce que leur dure de vie est trop courte, ou encore parce que lon estime que leur valeur documentaire est trop faible, et donc ils ne mriteraient jamais dy entrer.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 112/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Nous nous intressons donc ici aux documents phmres, qui disparaissent rapidement ou qui nont aucune vie documentaire .
Documents de courte vie

Quels sont ces documents de courte vie auxquels on fait rfrence ? Nous en examinerons quelques-uns ici.
Recherches ponctuelles sur le Web

On peut considrer comme des documents momentans les rponses obtenues pour une requte envoye un moteur de recherche : chacune des rponses constitue en effet un trs court document, dont la dure de vie nest souvent que de quelques minutes et dont le contenu est dict par les pratiques dun moteur de recherche donn. Ainsi, un moteur comme Google prsentera, avec chaque rponse, une description de la page vise (son URL, son format, la taille du document) ; ce sont des donnes extraites pour les besoins de laffichage des rponses, qui sont disponibles lorsque lon consulte le document mais auxquelles un butineur naura pas ncessairement accs, sil parvient au site autrement que par Google (par un hyperlien dune page amie, par exemple). On peut assimiler ces donnes aux descriptions de type catalographique, portant sur les proprits physiques ou externes du document. galement, chaque rponse de Google est accompagne dun court passage, qui se veut un rsum de la page repre. Le rsum est en ralit un extrait de certaines parties du document ; il est construit partir de rgles internes Google, qui assurent la prsence dau moins un des motscls de la requte. Il sagit donc dun rsum de type slectif, selon le point de vue de la requte formule. Ce type de rsum slectif savre trs utile : ds que lon reconnat la diversit des utilisateurs du Web, leurs intrts varis et leurs besoins variables, on prend conscience de lapport dun tel rsum cibl. Il permet de dcrire chaque document selon le point de vue de lutilisateur ; cest une adaptation remarquable de cette technique automatique pour tenir compte des utilisateurs. Il faut noter cependant que lextrait produit par Google est trs limit par rapport aux possibilits que lon entrevoit pour ces rsums slectifs. Le moteur de recherche ne fournit pas, par contre, un ensemble de termes dindexation qui caractriserait lensemble du document (rappelons que la rponse de Google se base sur le fait quune partie du document, et non le document au complet, semble pertinent pour la requte). Lindex complet de Google nest pas disponible pour visionnement, et ne serait vraisemblablement daucun intrt, puisquil est constitu de lextraction exhaustive de (presque) tous les mots de chaque document. On peut envisager ici quil serait souhaitable dobtenir, linstar du rsum

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 113/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

slectif, un petit ensemble de termes qui caractrise la portion du document qui semble dintrt pour la requte de lutilisateur. Dautres moteurs de recherche ont constat la ncessit de prsenter lutilisateur un condens de la page, et ceci est fait de diffrentes faons (voir le site dAbondance 128 , qui dcrit les principaux moteurs de recherche et annuaires selon divers paramtres, dont la faon dont ils prsentent les rsums). Dans plusieurs cas, le rsum prsent a t compos par un humain et dcrit la page au complet (et non le segment pertinent pour la requte). Notons enfin que les annuaires thmatiques (Yahoo!, La Toile du Qubec 129 ) recensent des sites Web, et non, isolment, les pages des sites. Ils proposent avec les rponses un rsum de chaque site, qui a t crit au pralable par un humain. Il sagit donc davantage dun rsum de type indicatif ou informatif (selon son niveau dexhaustivit par rapport au contenu du site Web). Pour caractriser les rponses une requte, on voit aussi le recours des formes de classification automatique 130 . Les moteurs de recherche qui offrent cette option examinent les rsultats obtenus pour une requte et, plutt que de les prsenter simplement par ordre systmatique (de pertinence), ils les regroupent dabord en classes. Le regroupement peut soprer sur la base des mtadonnes rattaches aux pages Web, ou bien tre effectues sur la base dune analyse du contenu des pages. Pour donner une ide : pour une requte sur mercure , lalgorithme de classification automatique peut dceler trois ensembles diffrents de mots qui co-occurrent frquemment : un ensemble contenant lment et mtal , un autre contenant plante et systme solaire , et un autre encore avec dieu , messager et commerce . Ainsi, les rsultats peuvent tre prsents en grappes. Il est noter que la classification est dynamique, cest-dire quelle dpend de la requte qui peut contenir plusieurs mots et quainsi la classification ne peut tre tablie une fois pour toutes. Voir aussi Vogel (2003) pour une autre conception de la classification dynamique.
Formulaires sur le Web

Un autre type de document de courte vie est en jeu lorsquun utilisateur remplit un formulaire sur une page Web (pour demander un produit ou un service de lorganisme). Le formulaire rempli sert satisfaire la demande du client. Il peut nexister quun court instant, le temps de dclencher les actions appropries (commande dun logiciel, rquisition dassurance, etc.) et ne jamais tre vers dans une base de donnes. Or, les informations fournies dans le formulaire peuvent constituer des donnes stratgiques pour lorganisme en question. Une indexation
128

. <http://www.abondance.com> [fvrier 2007]. <http://www.yahoo.com> et <http://www.toileduquebec.com> [fvrier 2007]. 130. Par exemple : WiseNut <http://www.wisenut.com> ou MetaCrawler <http://www.metacrawler.com>. Teoma <http://www.teoma.com> fait des oprations similaires dont le produit est lgrement diffrent. Sites visits en fvrier 2007.
129.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 114/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

automatique, ou la cration dun rsum sous une forme narrative, peut permettre de conserver linformation dsire.
Encans virtuels sur le Web

Considrons le cas des sites Web de types encans virtuels (on pense ici des sites comme e-Bay 131 ). On y mne des transactions commerciales foncirement phmres. Les informations impliques dans les transactions peuvent prsenter un intrt pour divers groupes de personnes : non seulement les consommateurs, mais aussi des sociologues ou des conomistes lafft de nouvelles tendances de consommation, par exemple. La seule faon de les capter, cest de le faire sur le vif, alors que les documents en question sont toujours vivants et que les transactions sont en cours.
Affichage doccasions daffaires sur le Web

Certaines collectivits se servent du Web pour afficher des occasions daffaires : offres de partenariat, appel doffres, etc 132 . Ces occasions sont limites dans le temps ; elles disparaissent au fur et mesure quune offre trouve preneur. La prsentation des offres adopte souvent un format tabulaire, qui pourrait tre exploit en tant que base de donnes ; mais les descriptions du dtail de loccasion daffaires contiennent habituellement une portion narrative, crite en langue naturelle comme le franais ou langlais, qui requiert un traitement plus sophistiqu danalyse documentaire automatise. Cette fois-ci, les informations qui sy trouvent sont utiles dans le moment prsent pour les entrepreneurs, mais elles peuvent aussi savrer trs intressantes pour tudier lvolution dun march, la force dun secteur de lconomie, etc. Seuls les traitements automatiques permettent dobtenir les rsultats dcrits ci-dessus : les rsums slectifs, ventuellement lindexation partielle dun passage et la classification des rsultats, tous selon la requte formule par lutilisateur ; lextraction danalyses de relations ou tendances partir de documents phmres ; etc.
Documents contenu variable

Dans le monde numrique, certains documents sont en mouvance constante. Nous pensons ici, par exemple, aux pages contenant la une des journaux en ligne, aux nouveauts de sites tablis ou aux annonces quotidiennes de sites commerciaux ou gouvernementaux. Souvent, la description de ces pages Web se rsume la mention nouveauts . Or il existe des contextes dutilisation (le journalisme ou la veille par exemple) o lon aimerait une description plus dtaille, et o il nest pas toujours ais de faire linventaire des sources quotidiennement la main. Certains moteurs de
131. 132.

<http://www.ebay.com> [fvrier 2007]. Exemple : Federal Business Opportunities, <http://www2.eps.gov/spg/index.html> [2004].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 115/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

recherche offrent un service spcial consacr ces pages de nouvelles qui changent souvent 133 ; le service est cependant limit une liste de sites slectionns au pralable. Il y a aussi les pages de type journal de bord (weblogs ou blogs ou encore blogues), phnomne rcent, dans lesquelles les auteurs consignent leurs tats dme du moment mais aussi leurs observations sur lactualit. Et l aussi, lindexation faite par les moteurs de recherche nest pas assez frquente pour suivre le rythme des parutions. De par leur instabilit, il est impensable de penser mettre du temps dcrire ce type de documents de faon dtaille. Mme leurs crateurs ne font que peu defforts pour leur assurer une description utile. Ils constituent donc un type de document pour lesquels les traitements automatiques peuvent devenir une solution.
Documents dont la valeur nest pas valide

La majorit des pages Web ordinaires ne reoivent pas de traitement documentaire labor. Si certains documents du Web sont traits la source par leur crateur ou le distributeur, leur assurant une plus grande visibilit, nombre de documents demeurent sans traitement documentaire. Une description automatise au moment de la requte ou du butinage peut savrer la seule option pour lutilisateur en qute dinformations. Cela permet en outre des communauts virtuelles de se crer, de se doter de documentation partager, sans avoir se constituer une structure formelle de gestion documentaire. Pour sortir du cadre des moteurs de recherche sur le Web, regardons maintenant les archives de courriels prsentes dans les organismes publics ou privs. Elles sont gnralement considres davantage utilitaires quinformationnelles. Cependant, elles contiennent un trsor dinformations sur divers aspects des affaires traites par lorganisme. On pourrait en extraire des analyses portant sur les associations entre metteur, contenu et destinataire (en dautres termes, qui envoie quoi qui). galement, on pourrait y reprer des communauts tacites, bases sur les habitudes de communication. Ce type dinformations (et dautres semblables) peut avoir une trs grande valeur marchande ; elles sont donc dun trs grand intrt pour les dcideurs. Pour tenter de rduire le volume des informations, il serait souhaitable aussi de procder un type de condensation (automatique) de leur contenu. Notons dailleurs que la classification ou catgorisation automatique de courriels est une fonctionnalit souvent recherche par les socits dont les services aux clients ou aux utilisateurs utilisent beaucoup le courriel. Pour leur part, les forums de discussion Usenet permettent des groupes dintrt donns dafficher des messages lintention de leurs membres (voir par exemple les forums Usenet de
133.

Par exemple, Google News <http://news.google.com/> [fvrier 2007], NewsTrawler <http://www.newstrawler.com/nt/nt_home.html> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 116/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Google 134 ) et ainsi dchanger de linformation ou de lexpertise. Ces messages sont volatils. Ils reprsentent en quelque sorte les blogs des annes 1980-1990, mais partagent plusieurs caractristiques avec les collections de courriels. Ils contiennent notamment des masses dinformations qui pourraient tre utiles, si seulement celles-ci taient organises, tries, classes, indexes ou rsumes autrement que chronologiquement ou par fil de discussion. Ici aussi, un utilisateur aimerait pouvoir consulter ces donnes selon son point de vue, ou selon un angle donn ; des techniques de classification dynamique selon une requte ou un profil dintrt seraient tout fait appropries.
Collections phmres

la notion de document phmre, dans le contexte dutilisation du Web on peut ajouter celle de collection phmre ; il sagit ici de lensemble des rponses donnes pour une requte. En effet, il est possible pour un utilisateur de conserver un ensemble de rsultats, auquel il peut vouloir revenir ultrieurement. La collection est doublement phmre : elle est constitue de faon ad hoc, par rapport une requte un point temporel donn, et peut ne plus jamais tre ncessaire en temps que collection ; mais aussi, elle est forme dhyperliens vers des documents qui risquent constamment de disparatre. Il est intressant de noter que la collection de rponses peut devenir un objet dtude en soi, mme dsincarne des pages auxquelles elle fait rfrence. En effet, on peut commenter la rponse donne par Google une requte donne une date prcise , comme tmoin du comportement du systme ou bien du contenu du Web. Cest une notion de collection qui est tout fait inusite, si on la compare aux contextes traditionnels. Dailleurs, cette collection phmre, stocke en tant que page HTML (page Web, donc) sur un site public, peut devenir son tour une rponse une requte ultrieure ; cet ensemble est impossible reproduire, tant donn la volatilit des documents sur le Web.
Dautres applications utiles

Nous ajouterons ici dautres utilisations possibles des traitements automatiques celles que nous avons dj voques (indexation automatique, condensation automatique, classification automatique). Les recherches actuelles en condensation automatique de textes (voir Hovy, 2003) se penchent en grande partie sur la problmatique de condensation multitextes : comment synthtiser les informations contenues dans un ensemble de documents. Les travaux ont port beaucoup,
134.

<http://www.google.com/grphp?hl=en&tab=wg&ie=UTF-8> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 117/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

jusqu prsent, sur des collections de dpches de nouvelles, mais le besoin de crer des synthses pour une collection quelconque existe partout. On voit ici lexemple dun outil (ou dune technique) qui est spcifique un genre. Les outils dvelopps pour le genre journalistique ne sont pas efficaces pour traiter dautres genres comme les courriels ou les appels doffres. Or, la recherche et le dveloppement de systmes automatiques sont toujours dicts par le type de problme que lon a tent de rsoudre. Ainsi, ladaptation de systmes existants de nouveaux genres ncessite un travail non ngligeable ; nous y reviendrons par la suite. Une autre application possible de la condensation automatique serait de constituer rapidement, partir de documents trouvs sur le Web, une biographie expresse dune personnalit quelconque ; une telle possibilit intresse les services de renseignements nationaux, pour leur permettre de profiter de tout document qui peut disparatre sans pravis ou pour pouvoir produire rapidement une description jour des activits dune personne ou dun organisme surveills. Bien sr, il existe galement de forts intrts commerciaux pour ce type dapplication : la possibilit dobtenir un portrait rapide des activits dune socit prive ou encore dun politicien peut aider constituer un plan daffaires. Comme les collections de documents utiliss pour les rsums multitextes peuvent varier linfini, seules les approches automatiques sont en mesure de rendre cet objectif commercialement viable. Lindexation automatique peut prendre bien des formes autres que ce qui est implant dans les index des moteurs de recherche. Par exemple, la tradition dindexation fine des livres (en anglais, back-of-the-book indexing) peut inspirer llaboration doutils permettant de naviguer lintrieur dun document numrique assez volumineux (voir notamment Da Sylva, 2002, 2004a et 2004b). Cette indexation fine nest pas envisageable pour toute une collection mais un utilisateur peut vouloir la produire sur demande, pour un nouveau document obtenu ; elle est donc tout indique pour le traitement de documents phmres. La possibilit de faire ceci est absente des outils actuellement disponibles pour naviguer dans les documents du Web. De plus, les analyses automatiques permettent dextraire des informations tacites ou implicites contenues dans des documents existants (forage textuel) ; on peut donc en extraire des informations au-del de ce que lauteur avait inclus explicitement (on pense ici par exemple lanalyse de textes en gntique afin de dcouvrir, par des analyses linguistico-statistiques, des corrlations entre enzymes, protines, gnes, etc.). Le forage textuel est lanalogue textuel du data mining (forage de donnes) utilis dans les grandes bases de donnes numriques ou factuelles. Cette application dpasse les possibilits de lextraction dinformations (voir Appelt 1999 ; Humphreys et alii 2000), qui permet dobtenir une description schmatique du contenu dun document et qui est aussi une application qui nous intresse ici. Ces types de traitements ne sont

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 118/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

pas du tout envisageables manuellement, vu la taille des bases de donnes constitues par ces normes collections de documents. Une autre application aussi, dont lintrt croisse avec le nombre de documents ajouts sur le Web, est celle de la slection automatique de documents : elle consiste rechercher des documents rpondant un profil donn (idalement, en tenant compte du contenu du document et non seulement de ses proprits physiques externes) et les ajouter alors une collection existante (un annuaire thmatique ou une bibliothque numrique, par exemple). Mme dans le cas o les rsultats seraient valids par un humain, la possibilit de traitement automatique augmente la productivit potentielle dune telle opration.

Avantages des traitements automatiques Les traitements automatiques offrent plusieurs avantages, quil est utile ici dopposer leurs faiblesses cites ci-dessus, tout en les contextualisant. Abordons dabord, bien sr, la question de la rapidit de traitement. Celle-ci permet de traiter des collections de taille monumentale. Il faut par contre comprendre que si les traitements simples sont effectivement trs rapides mme sur une collection norme, certains traitements plus sophistiqus ne sont pas instantans ; dautres encore exigent des annes de travail pour toute une quipe (par exemple, les systmes de traduction automatique, de correction automatique, etc.) tout en narrivant jamais un taux de succs de 100 %. Ensuite, le traitement automatique, ralis par un systme unique, peut tre dcrit comme centralis ; par consquent, on peut sattendre une meilleure cohrence des rsultats dans le temps. On gagne beaucoup ici. Une exception possible cette rgle serait les systmes adaptatifs, qui peuvent apprendre daprs les habitudes de travail de lutilisateur (et ainsi donner des rsultats diffrents au fur et mesure que le systme sadapte celui-ci). Il ne sera pas possible alors datteindre une parfaite cohrence dans le temps ; ce comportement volutif ne doit cependant pas tre vu comme un dsavantage, mais bien comme un atout comme lexprience acquise par un analyste chevronn. Un autre facteur favorisant la cohrence est la mmoire infaillible des systmes automatiques. Plus fidle que la mmoire humaine, elle assure de pouvoir rcuprer le rsultat des traitements antrieurs, qui peuvent servir de guide ou modle (on peut faire ici un parallle avec les systmes de traduction automatique qui utilisent une mmoire de traduction pour rcuprer des traductions antrieures). Bien sr, lavantage offert par lutilisation des mmoires suppose que les archives demeurent intactes et lisibles, ce qui savrera en fait un dfi de taille.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 119/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Un avantage important est la tolrance quont les systmes automatiques lennui d la rptition : cet aspect est bien souvent lorigine de propositions de traitement automatique. En particulier, une tche facile mais rptitive peut avantageusement tre confie au traitement automatique (par exemple, le reprage des noms propres dans un document), librant lexpertise humaine pour les moments o elle est requise. Enfin, relevons la transparence du traitement possible par un systme automatique. On scrute plus facilement le code dun systme informatique que le cerveau et les connaissances des analystes humains (les expriences en intelligence artificielle des annes 1980 sont arrives de telles conclusions). En principe on peut faire en sorte que le systme permette dexaminer les tapes de traitement. En ralit, cette fonctionnalit nest pas souvent incluse, mais il serait utile quelle le soit. Tout de mme, cest cette proprit des traitements automatiques qui est la plus sduisante. Elle permet de dcrire explicitement les tapes du traitement et peut servir, loccasion, de guide mthodologique pour le traitement humain. Un dernier avantage que nous relverons pour les traitements automatiques, ce sont les nouvelles possibilits quils amnent. Nous avons indiqu ci-dessus certains rsultats qui ne peuvent tre obtenus que par une analyse automatique, notamment la production de rsums ou de classifications qui seraient bass sur les besoins ou les requtes des utilisateurs. Comme ces besoins varient dun individu lautre, et pour le mme individu dans le temps, les systmes automatiques permettent de faire varier les rsultats selon les besoins du moment. Cela sapplique bien sr non seulement pour le traitement des documents phmres, mais aussi pour dautres documents et collections. Et cest donc au point de vue de la flexibilit que les traitements automatiques se dmarquent.

Nouvelles exigences Quelles exigences doit-on imposer aux traitements automatiques ? En effet, si lon veut dfendre cette possibilit pour des documents phmres, on doit leur assurer un certain niveau de qualit ou de performance.
Normalisation

La prolifration doutils de traitements automatiques peut savrer plus problmatique quutile, si les efforts raliss de tous cts produisent des rsultats qui ne peuvent tre exploits ultrieurement, qui ne peuvent tre changs entre systmes. Dit autrement, ne pas chercher une normalisation dans les rsultats des systmes fait perdurer leur rputation de joueurs non disciplins. Des efforts de normalisation des formats de donnes, en harmonie avec ceux du W3C

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 120/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

(World Wide Web Consortium 135 ) sur les formats de documents (illustrs par exemple par le Text Encoding Initiative, Sperberg-McQueen et Burnard, 1995) et de mtadonnes (par exemple, les initiatives lies aux mtadonnes descriptives du Dublin Core 136 ou de RD 137 ), sont encourager.
Multilinguisme

Les systmes de traitement automatique sont souvent dvelopps pour traiter une seule langue. Par exemple, ils peuvent exiger des ressources linguistiques comme des dictionnaires, des thsaurus, des anti-dictionnaires, etc., ou alors ils peuvent tre labors par des mthodes statistiques, suite un entranement sur des corpus dune langue donne. Ils sont donc limits traiter cette seule langue (ou, ventuellement, un petit ensemble de langues). La mondialisation des ressources dinformation entrane des besoins de dveloppement de systmes multilingues (voir une discussion dtaille dans Da Sylva, 2003). Les critres dvaluation pour les systmes automatiques devraient donc inclure leur capacit traiter plus dune langue.
Langage documentaire

Il est important de prendre conscience du fait que, du point de vue du langage documentaire utilis, les approches les plus faciles dun point de vue automatique ont des limites importantes. Une indexation automatique faite avec les techniques de pointe peut tre trs performante, mais utilisera probablement le vocabulaire libre (par extraction directe dexpressions du document). On en connat les inconvnients en gestion documentaire : rappel plus bas et prcision trop leve, dus labsence dabstraction de la terminologie utilise dans louvrage, ce qui mne une faible cohrence dindexation. Le dfi ici est donc de poursuivre les travaux pour doter ces systmes de ressources permettant lindexation par assignation de termes issus dun vocabulaire contrl. Les divers travaux en construction automatique de thsaurus (voir notamment Bertrand-Gastaldy et Pagola 1992 ; Grefenstette 1994 ; Hearst, 1998 ; Sundblad, 2002) reprsentent un point de dpart, mais sont confronts la tension entre thsaurus spcialiss (trop troits mais prcis), et thsaurus gnraux (trop ambigus mais porte plus large) ; ces derniers dpendent alors des avances en dsambigusation lexicale en contexte (voir Stevenson et Wilks, 2003), pour guider le systme vers la bonne interprtation donner aux mots ambigus ou polysmiques. Au sujet des langages documentaires, regardons un cas problme, soit la terminologie mouvante des documents dactualit. Le traitement automatique des dpches de nouvelles est compliqu par le fait quun nombre important de nologismes apparat sur une base quotidienne : des noms de personnes, dorganismes, de concepts mergents, dinnovations technologiques, etc.
135. 136.

<http://www.w3c.org> [fvrier 2007]. <http://dublincore.org> [fvrier 2007]. 137. <http://www.w3.org/RDF/> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 121/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Une des pistes de recherche poursuivre sera de dvelopper des techniques danalyse adaptes ce vocabulaire constamment en volution (voir entre autres Nadeau et Foster, 2004). ce mme chapitre des langages documentaires, nous incluons la forme des rsums produits de faon automatique. Notons dabord que plusieurs systmes exprimentaux sont labors en prenant comme modle des rsums dauteurs, qui sont diffrents des rsums documentaires. Parmi les diffrences qui distinguent ces deux types de rsums, le plus important est labsence de connaissances des principes dorganisation de linformation, auxquels nous reviendrons ci-dessous. Par ailleurs, il est encore aujourdhui trs difficile (voire impossible) dlaborer des systmes de condensation automatique qui saisissent rellement le sens des documents. Donc, les systmes existants procdent par heuristiques, la plus courante tant de crer non pas un condens du document, mais un extrait , produit par juxtaposition de phrases cls extraites du document. Les phrases cls sont slectionnes daprs un ensemble de critres varis ; ces mthodes sont trs ingnieuses, mais elles possdent une limite importante, celle de rutiliser uniquement des phrases existantes (avec quelques bmols dont nous faisons abstraction ici). Il faut comprendre que le rsum rsultant est trs prs du style de lauteur, et que par consquent la qualit du rsum produit est trs variable dun document lautre. Il est difficile, avec les techniques existantes, de voir comment rsoudre ce problme ; cela demandera davantage de recherche dans la formulation finale des rsums. Cet aspect de contrle du vocabulaire (et celui de normes partages, ci-dessus) ne pourra tre incorpor aux systmes de traitement automatique quen duquant les concepteurs de ces systmes au sujet des impacts de labsence de normalisation et duniformisation. Ces rflexions nous amnent la conclusion suivante : que les critres dvaluation pour les traitements automatiques, diffrents de ceux applicables pour les traitements manuels, doivent tre dicts par une modlisation efficace des processus danalyse documentaire en jeu.
Modlisation et principes dorganisation de linformation : pistes pour lvaluation

Une bonne partie du cursus en science de linformation vise inculquer aux apprenants ce que nous appellerons les principes dorganisation de linformation . Il sagit de principes qui dictent quelles sont les proprits dun systme dinformation russi. Parmi ces principes, on trouve celui de lexactitude (accuracy), de la reprsentation suffisante et ncessaire, etc. On en trouve une description notamment dans Svenonius (2000, p. 68 et suivantes). Lensemble de ces principes dcrit les objectifs atteindre (qui peuvent ltre plus ou moins, bien sr, mme dans un systme dinformation non automatique). Ces objectifs font abstraction de la mthode utilise pour arriver

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 122/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

aux rsultats, et ont ainsi le potentiel dtre exploits pour dcrire le niveau de succs dun systme automatique. Il existe un lien important entre les principes dorganisation et la notion de modlisation, si fondamentale llaboration de systmes informatiques. Il devient trs intressant dexplorer jusqu quel point lactivit de gestion documentaire peut tre modlise avec succs ; ceci exigera de puiser dans plusieurs champs disciplinaires, dont la linguistique, la psychologie cognitive, lpistmologie, la communication, etc. Chose importante, une bonne modlisation peut produire des critres et des schmes dvaluation trs pertinents.
Conservation des rsultats

Enfin, plus spcifiquement, pour traiter les documents phmres, une considration importante est celle de la conservation des rsultats et des documents : les traitements automatiques trouveront plus facilement leur place sils permettent, en plus, de contrer la volatilit des documents viss. Certains documents phmres, normalement vous la disparition, pourront tre considrs dignes de conservation par lutilisateur qui les aura reprs : il faudrait donc fournir au sein mme du systme une faon de conserver le document, ou de stocker linformation extraite. Dans certains cas, le rsultat du traitement pourra remplacer le document original, et cest ce qui pourra tre conserv long terme. Cela crera donc des documents fantmes, des reprsentants de documents qui seront disparus. Bien sr, alors, la qualit du traitement automatique devra tre la mesure de cette exigence de rutilisation du simple reprsentant.

Conclusion Il apparat que les traitements automatiques reprsentent une solution au traitement documentaire de documents phmres, qui seraient normalement exclus de la chane documentaire. Ils leur permettent de connatre une certaine prennit, si cela est dsir par un utilisateur ou un groupe dutilisateurs. De plus, les traitements automatiques rendent possibles pour ces documents des traitements impossibles atteindre manuellement. Les exigences attendues de ces systmes doivent tre adaptes la nature du traitement ; notamment, on prvoit que, titre dinstrument dvaluation, on aura besoin dune solide modlisation du traitement documentaire, dtermine par les principes qui rgissent lorganisation de linformation. Bien sr, mesure que la qualit des rsultats connatra des amliorations notables, on verra un intrt tendre lapplication des traitements documentaires automatiques des documents durables. Il existe dailleurs quelques cas (isols, mais intressants) dintroduction de traitements

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 123/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

automatiques dans des services dinformation, o lexpertise humaine est roriente. Pour permettre une amlioration dans les performances des systmes de traitement documentaire automatique, il importe que les connaissances issues de la tradition bibliothconomique et des sciences de linformation soient mises contribution et dterminent les exigences des systmes labors.

Bibliographie
AFNOR (Association franaise de normalisation), Information et documentation : principes gnraux pour l'indexation des documents, Paris, Afnor, 1993. AFNOR (Association franaise de normalisation), Principes directeurs pour ltablissement des thsaurus multilingues, Z47-101, Paris, Afnor, 1990. ANDERSON, J.-D., Standards for indexing : revising the American National Standard Guidelines Z39.4 , Journal of the American Society for Information Science, vol. 45, n8, 1994, p. 628-36. APPELT, D.-E., Introduction to information extraction , AI Communications, vol. 12, n 3, 1999, p. 161-172. BERTRAND-GASTALDY, S. et PAGOLA, G., L'analyse du contenu textuel en vue de la construction de thsaurus et de l'indexation assistes par ordinateur ; applications possibles avec SATO , Documentation et bibliothques, vol. 38, n2, 1992, p. 75-89. COOLEY, R., PANG-NING, T. et SRIVASTAVA, J., Discovery of interesting usage patterns from Web data , in Proceedings of the WEBKDD Workshop, 1999 (Lecture Notes in Computer Science, vol. 1836), Springer, Berlin, 2000, p. 163-182. Da SYLVA, L., Relations smantiques pour lindexation automatique. Dfinition dobjectifs pour la dtection automatique , Document numrique, Numro spcial Fouille de textes et organisation de documents , vol. 8, n3, 2004b, p. 135-155. Da SYLVA, L., Indexation automatique de documents par combinaison danalyses statistiques et terminologiques structures , Actes du colloque RIAO'04, Avignon, 26 au 28 avril, 2004a, p. 895-904. Da SYLVA, L., Technologies facilitatrices pour la dissmination de la communication scientifique multilingue , Communication dans le cadre du colloque La communication scientifique en quatre dimensions, 5 juin 2003, Montral. Da SYLVA, L., Nouveaux horizons en indexation automatique de monographies , Documentation et bibliothques, vol. 48, n4, oct.-dc. 2002, p. 155-167.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 124/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

GREFENSTETTE, G., Explorations in automatic thesaurus discovery, Dordrecht, Kluwer Academic Publishers, 1994. HARMAN, D., Overview of the 3rd Text Retrieval Conference (TREC-3), Washington, National Institute of Standards and Technology (NIST) Special Publication 500-225, US Government Printing Office, 1995. HARMAN, D., Overview of the 4th Text Retrieval Conference (TREC-4), Washington, National Institute of Standards and Technology (NIST) Special Publication 500-236, US Government Printing Office, 1996. HEARST, M., Automatic Acquisition of Hyponyms from Large Text Corpora , Proceedings of the Fifteenth International Conference on Computational Linguistics, Nantes, France, 1992, p. 539-545. HOVY, E., Text Summarization , in Mitkov, R., (d.), The Oxford Handbook of Computational Sematics, Oxford ; New York, Oxford University Press, 2003, p. 583-598. HUMPHREYS, K., DEMETRIOU, G. et GAIZAUSKAS, R., Bioinformatics applications of information extraction from scientific journal articles , Journal of Information Science, vol. 26, n2, 2000, p. 75-85. LAPPIN, S., Semantics , in Mitkov, R., (d.), The Oxford Handbook of Computational Sematics, Oxford, New York, Oxford University Press, 2003, p. 91-111. LEININGER, K., Interindexer consistency in PsycINFO , Journal of Librarianship and Information Science, vol. 32, n 1, 2000, p. 4-8. MacDOUGALL, S., Signposts on the Information Superhighway: Indexes and Access , Journal of Internet Cataloguing, vol. 2, n 3/4, 2000, p. 61-79. MUC, Proceedings of the 6th Message Understanding Conference (MUC-6), San Mateo, California, Morgan Kaufmann, 1995. MUC, Proceedings of the 7th Message Understanding Conference (MUC-7), San Mateo, California, Morgan Kaufmann, 1998. NADEAU, D. et FOSTER, G., Real-Time Identification of Parallel Texts from Bilingual News Feed , Proceedings of CLiNE'04, Universit Concordia, 30 aot 2004, p. 21-28. OVER, P., Overview of DUC 2002 , DUC 2002 Conference Proceedings, National Institute of Standards and Technology, Gaithersburg, Md., 2002 ; <http://wwwnlpir.nist.gov/projects/duc/pubs.html> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 125/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

RAMLY, M.-L. et STROULIA, E., Analysis of Web-usage behavior for focused Web sites: a case study , Journal Of Software Maintenance And Evolution : Research And Practice, vol. 16, n 1-2, 2004, p. 129-150. SAGGION, H. et LAPALME, G., Selective Analysis for the Automatic Generation of Summaries , Proceedings of the 6th ISKO Conference, 10-13 July 2000, Toronto, Canada. SAGGION, H. et LAPALME, G., Generating Indicative-Informative Summaries with SumUM , Computational Linguistics, vol. 28, n4, 2002, p. 497-526. SCHLESINGER, J.-D., CONROY, J.-M., OKUROWSKI, M.E et O'LEARY, D.P. Machine and human performance for single and multidocument summarization , IEEE Intelligent Systems, vol. 18, n1, 2003, p. 46-54. SPERBERG-MCQUEEN, C.M. et BURNARD, L. The Design of the TEI Encoding Scheme , Computers and the Humanities, vol. 29, n1, 1995, p. 17-39. Reproduit dans : Ide, N., Veronis, J., The Text Encoding Initiative : Background and Contexts, Boston, Dordrecht, Kluwer Academic Publishers, 1995. STEVENSON, M. et WILKS, Y., Word-Sense Disambiguation , in Mitkov, R. (ed.), The Oxford Handbook of Computational Sematics, Oxford ; New York, Oxford University Press, 2003, p. 249-265. SUNDBLAD, H., Automatic Acquisition of Hyponyms and Meronyms from Question Corpora , Proceedings of the Workshop on Natural Language Processing and Machine Learning for Ontology Engineering (OLT'2002), Lyon, France, 2002. SVENONIUS, E., The Intellectual foundation of information organization, Cambridge, Mass., MIT Press, 2000. VOGEL, C., Using dynamic classification to expand individual/intuitive search processes , Proceedings of International Conference on Integration of Knowledge Intensive Multi-Agent Systems (KIMAS), Boston, Sept. 30-Oct. 3, 2003, p. 523-528.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 126/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Le document numrique dynamique : une toile filante dans lespace documentaire


Katarzyna WEGRZYN-WOLSKA Esigetel, cole suprieure dingnieurs en informatique et gnie des tlcommunications
Rsum : La majorit de pages Web existantes actuellement sont des pages Web cres dynamiquement. Ces documents qui n'existent pas rellement, sont crs pour une demande individuelle (automatique ou manuelle) et ils disparaissent aprs leur consultation. Cet article sintresse aux problmes de la dure dexistence, daccessibilit et darchivage de ces pages. Les diffrentes dfinitions, catgorisation des documents dynamiques et leur mise en uvre sont introduites dans un premier temps pour ensuite analyser les rsultats de diffrents tests statistiques effectus dans lobjectif dvaluation de dure de vie de documents numriques dynamiques. La taille de l'espace documentaire exploitable dans la forme numrique augmente de plus en plus rapidement. Avec cette croissance nous observons une diversification de formes et formats des documents numriques : les documents statiques et dynamiques, les pages Web trs varies et les documents multimdia sur les diffrents supports. Cet article aborde les problmes de la dure de vie, de lactualisation et darchivage des pages Web dynamiques.

Caractre de documents dynamiques et ses diffrentes dfinitions

Document lectronique et ses dfinitions

Avant de dfinir le terme document dynamique , il est souhaitable de prciser la signification des termes document et document lectronique comme tels. Voici la dfinition donne par le Centre ATO (UQAM) et lEBSI (Universit de Montral) 138 :
Document : Dsigne une entit identifie et structure contenant, entre autres, textes, tableaux, images et sons, pouvant tre un objet dtude, de traitement manuel ou lectronique (par exemple, l'archivage), et dchange entre des utilisateurs. Cest donc une entit constitue dun contenant et dun contenu ; ce dernier ayant surtout la caractristique dtre communicatif au niveau social. Ainsi, par exemple, une pierre en
138.

Centre ATO de l'universit du Qubec Montral (UQAM) et L'cole de bibliothconomie et des sciences de l'information (EBSI) de l'universit de Montral, Glossaire des termes d'ATO. <http://www.ling.uqam.ca/sato/glossaire/index.html> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 127/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

soi ne peut constituer un document ; par contre, une pierre grave dcriture peut en constituer un. De mme, du texte, de l'image ou encore du son sur un support lectronique peut constituer un document. Dans ce cas, on parle de document lectronique.

Figure 1. Juste la pierre ou document ? Images extraites de : http://www.malexism.com/medias/rosette.html ; http://www.pinczow.com/muzeum/images/kamien.jpg ; photothque de lauteur.

Il est tout fait intressant de poser la question sur ce quest le document lectronique dynamique. Est-ce que cest un vrai document ou juste une prsentation temporaire de donnes ? Est-ce que les documents dynamiques sont des documents crs de faon automatique, ou transforms en fonction des actions de lutilisateur ? Le terme dynamique en tant que tel, est utilis plusieurs titres : pour les documents contenant diffrents moyens HTML dynamiques comme les calques , scripts, etc., mais le terme de pages dynamiques correspond davantage des pages construites la vole sur le serveur. Quelle est donc la signification du terme document dynamique et la dfinition utilise dans cet article ? Cet article analyse en particulier les documents crs en ligne sur le serveur. Le terme document dynamique (synonyme page dynamique ) est dfini par la Banque de terminologie du Qubec, dans Vocabulaire dInternet accessible en ligne 139 .
Document dynamique : (page dynamique) cest une page Web cre en rponse la demande d'un utilisateur, dont la forme est fixe et le contenu variable, ce qui permet ainsi de l'adapter aux critres de recherche de celui-ci.
139.

Banque de terminologie du Qubec Vocabulaire d'Internet <http://www.olf.gouv.qc.ca/ressources/bibliotheque/dictionnaires/> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 128/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Mise en uvre de document dynamique

Le document dynamique est cr en ligne. Un serveur Web (serveur HTTP) rpond une requte HTTP en renvoyant une page Web qui peut tre une page statique ou dynamique. Lorsque la requte contient la demande dune page dynamique (par exemple avec des donnes du formulaire en ligne), le serveur Web transmet toutes les donnes une application (programme) demande en vue de leur traitement et de la cration de la rponse (page Web cre comme rsultats dexcution de programme demand). Ensuite le serveur Web renvoie cette rponse sous la forme de page Web.
Diffrentes catgories des documents dynamiques

Existe-t-il diffrents types de documents dynamiques ? Pour rpondre cette question, il faudra prendre en compte aussi les diffrents aspects de leur cration. Les documents dynamiques peuvent tre construits sur la demande individuelle de lutilisateur en fonction de ses requtes (rsultats de recherche sur le moteur de recherche, rponses partir de donnes dans le formulaire, etc.) ou ils peuvent tre crs ou modifis automatiquement par lapplication spcialise (comme les diffrents sites dactualit, forums de discussions, etc.). En consquence, le comportement et la caractristique de ces deux types de documents sont diffrents. Cest pourquoi les deux catgories de documents dans larticle sont traites sparment. La premire catgorie de documents crs sur la demande particulire de lutilisateur est analyse et prsente sur lexemple de pages de rponses venant de moteur de recherche. La deuxime catgorie, les documents crs automatiquement, est prsente sur lexemple de pages venant de diffrents services de news et de sites de Weblogs.
Dure de vie et ge de documents dynamiques

Comment analyser la dure de vie de documents dynamiques si les documents dynamiques n'existent pas rellement, et sils disparaissent de la mmoire de lordinateur aprs leur consultation ? Dans larticle, la dure de vie de ces documents est considre comme le temps pendant lequel les rponses la mme requte ne sont pas changes. En plus, cest ce temps qui est visible pour l'utilisateur, puisque pour lui la diffrence en consultation de ces deux types de documents (dynamiques, statiques) est transparente. Lutilisateur dans son navigateur ne fait pas de distinction sur la manire dont le document consult a t cr. La deuxime question qui vient automatiquement est la question suivante : comment prciser lge de document dynamique ? Par lexemple est-ce que la valeur indique dans len-tte http : Modified et Expired, ou dans Meta Tag Expires dun fichier HTML, indique vraiment quand le contenu du document a t modifi, et quand ce document doit tre considr comme expir ? Dans cet article les problmes de dure de vie, daccessibilit et darchivage de documents dynamiques sont prsents sparment travers des exemples de sites (crant les pages dynamiques) dactualit, de Weblogs et de moteurs de recherche.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 129/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Les sites dactualit (News)

Sur le Web, il existe beaucoup de sites offrant le service dactualit (News). Mme sils publient toutes les diffrentes informations dactualit et les dpches de presse, les informations diffuses sur ces sites sont diversifies (Christophe Asselin, 2004). Il existe les sites gnraux comme lactualit mondiale et lactualit rgionale, mais aussi les sites dactualit dans des domaines plus prcis. La majorit de tous ces services est cre automatiquement, les informations dactualits sont mises jour instantanment, sans interruption tout au long de la journe, ainsi le lecteur de ces services retrouve des nouvelles de dernires minutes chaque fois quil consulte la page de news. Par contre, il est souvent possible daccder aux anciens articles partir darchives disponibles sur leurs sites. La dure darchivage pour diffrents sites est assez varie. Le tableau 1 prsente les valeurs comparatives de temps de mise jour et de la dure darchivage pour les diffrents services dactualit. Ces valeurs estimes auparavant par des tests effectus sur les sites concerns, ont t confirmes par les rponses reues de la part de diffrents sites interrogs ensuite.
Les sites des Weblogs

Weblog (en anglais : log, weblog ou blog ; en franais : blogue ou joueb ) est un journal mis jour rgulirement, sous la forme dune page Web volutive, prsentant des informations de toutes sortes, gnralement des pages dynamiques contenant des messages mis jour rgulirement (Rebecca Blood, 2002 et Stephanie Booth, 2002).

Figure 2. Exemple de page de weblog Slashdot (page HTML et son fil RSS).

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 130/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Service de news Google franais Google Actualit Voila Dpche Voila CNN Yahoo!News TF1 news News now Les Infos CategoryNet Portail de la presse et des RP

url <http://news.google.fr> <http://news.google.com> <http://actu.voila.fr/> <http://actu.voila.fr/Depeche/> <http://www.cnn.com/> <http://fr.news.yahoo.com/> <http://news.tf1.fr/news/> <http://www.newsnow.co.uk/> <http://www.lesinfos.com/> <http://www.categorynet.com>

Actualisation ~20 min ~20 min 1 jour en temps rel (~30min) instantanment instantanment 5 minutes

Archivage 30 jours 30 jours 1 semaine 1 semaine

1 semaine

partir de 2000 Chaque jour : lundi indfiniment jeudi pas actualis : vendredi - dimanche (sauf info. brlante) CompanynewsGroup <http://www.companynewsgroup.com> en temps rel, en 2003 et 2004 linformation moyenne 40 archivs ; officielle des communiqus par 1999 2003 en projet socits jour Tableau 1. Paramtres comparatifs (rafrachissement et archivage) pour les diffrents services dactualit.

Moteurs de recherche

Les rponses fournies par les moteurs de recherche sont des pages de rponses dynamiques, cres en ligne. La dure dexistence (laccessibilit) dune page de rponses, cest--dire le temps pendant lequel le moteur de recherche fournit la page identique, dpend bien sr des rponses retrouves par le moteur de recherche dans sa base dindex. Il est alors bien corrl avec la frquence de mise jour de la base dindex. Le Tableau 2 contient les exemples de valeurs de temps de mise jour dindex pour les diffrents moteurs de recherche.
Moteur de recherche URL Google <http://www.google.com> <http://www.google.fr> All the Web <http://www.alltheweb.com> Mise jour dindex 4 semaines mais certaines pages sont rafrachies quasi quotidiennement trs frquente, indique la date de depuis le printemps 2004 visite par les robots index commun avec Yahoo! depuis le printemps 2004 index commun avec Yahoo!

AltaVista

<http://fr.altavista.com/>

Tableau 2. Paramtres comparatifs (mise jour des bases dindex) pour les diffrents moteurs de recherche.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 131/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Archivage

Analysant le problme de documents dynamiques il faut aussi poser la question : quelle est laccessibilit et comment sont archivs les documents dynamiques, documents qui disparaissent aprs la consultation ? Les possibilits darchivage sont trs diffrentes. Les documents numriques dynamiques peuvent tre imprims (matrialisation de document, processus contraire de numrisation) ou sauvegards par leurs demandeurs ou par les diffrents systmes de caches et d'archives spcialises. Il existe beaucoup de diffrents outils qui archivent limage du Web actuelle (par exemple Wayback Machine de The Internet Archive 140 ). Ces outils essaient de retrouver et darchiver toute la partie du Web visible (Steve Lawrence, 2001).

Figure 3. Exemple de pages darchivage de Wayback Machine pour le site de Google news et BBC.

Bien sr cest une tche trs difficile. La taille du Web et le dynamisme de changement sont tellement grands quils rendent larchivage complet de limage du Web pratiquement impossible. Lexemple de larchive effectue par le Wayback Machine sur les pages dactualit de GoogleNews et BBC est prsent sur la figure 3. La comparaison des archives existantes sur ce site avec les donnes des statistiques effectues (figure 6, Tableau 1) montre que ltat darchive prsent sur le site de Wayback Machine est bien loin dtre complet.

Expriences et statistiques ralises Larticle analyse la frquence de la mise jour de base dindex de moteurs de recherche et mta-moteurs de recherche et les rsultats de diffrents tests statistiques effectus sur les diffrents sites dactualit et de Weblogs. Le choix de diffrencier les documents dynamiques en sparant les
140.

<http://www.archive.org/index.php> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 132/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

documents dactualit des pages de rponses de moteurs de recherche est justifi, puisque globalement le temps dexistence de contenu des pages de rponses venant de moteurs de recherche est beaucoup plus grand. Lvaluation de frquence de mise jour de base dindex de moteur et mta-moteur de recherche est base sur les expriences acquises pendant les travaux de ralisation d'un outil ayant pour but de retrouver les documents de l'administration franaise grce la mthode de mtarecherche (Wegrzyn-Wolska, Katarzyna, 2001 et 2004). Ces expriences ont t ralises entre autres pour valuer la pertinence des rponses et pour valider les liens vers les documents rponses. Les donnes et les rsultats obtenus peuvent tre utiliss pour lvaluation de la dure de vie des documents dynamiques, puisque tous les documents rponses fournis par les moteurs de recherche et mta-moteurs de recherche interrogs sont toujours des documents dynamiques dans le sens de la dfinition introduite dans cet article. Une mthode assez simple de lestimation de frquence de mise jour de bases dindex est lanalyse de frquence de passage de robots dindexation utiliss par le moteur de recherche. Lexemple des donnes de passage de robots rcuprs partir de fichier log. est prsent sur la figure 4.

Figure 4. Frquence des visites de robots dindexation de moteurs de recherche.

Pour valuer le temps dexistence de pages dynamiques, certains tests statistiques ont t effectus sur les pages de sites dactualit (analyse de fil rss). Les statistiques effectues et lanalyse des rsultats obtenus montrent que le comportement de tous les sites tests est assez vari. En consquence, les valeurs de temps dexistence de page sur tous ces sites sont galement varies (figure 10, figure 11, tableau 3). Quatre catgories de sites diffrents ont t analyses : la rubrique JO de Sportstrategies (service dactualit dans le domaine de sport), lactualit franaise sur le site de TF1, lactualit mondiale sur le site de BBC et le site de Weblog (Slashdot.org).

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 133/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Sportstrategies est un exemple de site pour lequel les modifications dactualit sont trs rgulires, avec un temps de rafrachissement stable. Dans le cas de Sportstrategies les actualits sont diffuses rgulirement toutes les heures (figure 5).

Figure 5. Dure dexistence de page dactualit des JO 2004 Athnes diffuse par le site Sportstrategies.

Lactualit mondiale sur le site de BBC est diffuse en temps rel. Les valeurs de temps dexistence des pages assez court et irrgulier (figure 6) prouvent le dynamisme des actualisations des articles diffuss instantanment.

Figure 6. Dure dexistence de page dactualit de service BBC.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 134/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Les articles et dpches de presse diffuss par le site de TFI sont actualiss assez frquemment pendant la journe. Par contre, il ny a aucune modification de contenu de page dactualit durant la nuit. Les temps dexistence de page pour ce site sont trs diffrents dans ces deux cas. Pour bien illustrer les diffrents comportements du site TF1 pendant la journe et la nuit, ces deux situations sont prsentes sparment (figure 7 et figure 8). Les deux pics lextrmit du graphe prsent sur la figure 7 correspondent aux pages dactualit testes durant la nuit (page sans changements).

Figure 7. Dure dexistence de page dactualit de service TF1 Actualit 24 heures/24.

Figure 8. Dure dexistence de page dactualit de service TF1 Actualit pendant la journe.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 135/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Le dernier site analys est le site de Slashdot.org. Ce site de weblogs collectifs est un site de rfrence pour tous les fans de linformatique et en particulier de logiciels open source. Les informations changent rapidement, les nouveaux articles sont proposs trs souvent et la discussion sur les thmes actuels est pratiquement sans arrt, en continu pendant la journe et la nuit aussi. Il nest pas donc trs tonnant que le temps dexistence de la mme page sur le site Slashdot soit extrmement court (figure 9), le temps moyen dexistence de la page est gal 77 secondes (cf. tableau 3).

Figure 9. Dure dexistence de page de Weblog Slashdot.

Service test Slashdot.org BBC.News TF1.actu (24/24) TF1.actu (jour) Sportsynergies

Dure de vie Moyenne 77 secondes 8,5 min 19,5 min 6,3 min 56 minutes

Min. 10 secondes une minute une minute une minute 9 minutes

Max. 22 minutes 66 minutes 502 minutes 49 minutes 61 minutes

Tableau 3. Comparatif de temps dexistence de page pour les diffrents services tests.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 136/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Figure 10. Temps min., max. et moyenne de lexistence de page pour les services tests (TF1 24/24).

Figure 11. Temps min., max. et moyenne de lexistence de page pour les services tests.

Conclusion Les documents numriques dynamiques nexistent pas vraiment, gnralement ils disparaissent de la mmoire aprs consultation. Leur relle dure de vie est donc trs courte. Par contre, les expriences effectues montrent que les documents dynamiques restent accessibles beaucoup plus longtemps grce aux diffrents systmes darchivage. La gestion de

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 137/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

dure de vie des documents dynamiques archivs devient identique celle des documents statiques, puisque les documents dynamiques sont archivs sous forme statique.

Bibliographie
ASSELIN, C., Chercher dans lactualit rcente ou les archives d'actualits franaises et internationales, 2004, <http://c.asselin.free.fr/french/actua.htm> [fvrier 2007]. BLOOD, R., The Weblog Handbook: Practical Advice on Creating and Maintaining Your Blog, Perseus Books Group, 2002. BOOTH, S., Cest Quoi Un Weblog, 2002, <http://spirolattic.net/CestQuoiUnWeblog>, [2004]. LAWRENCE, S., Online or Invisible? , Nature, Volume 411, Number 6837, 2001, p. 521. On-line version : <http://citeseer.ist.psu.edu/online-nature01> [fvrier 2007]. WEGRZYN-WOLSKA, K., tude et ralisation dun meta-indexeur pour la recherche sur le Web de documents produits par ladministration franaise, Thse de doctorat A/339/CRI, cole des Mines de Paris, Dcembre 2001. WEGRZYN-WOLSKA, K., FIM-MetaIndexer: a Meta-Search Engine Purpose-Built for the French Civil Service and the Statistical Classification of the Interrogated Search Engines, WSS04 The Second International Workshop on Web-based Support Systems avec le IEEE/WIC/ACM International Conference on Web Intelligence, Beijing, China, Septembre 2004.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 138/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Processus de documentarisation dans les Documents pour lAction (DopA) Statut des annotations et technologies de la coopration associes
Manuel ZACKLAD Universit de Technologie de Troyes (UTT) ICD/Tech-CICO FRE CNRS 2848
Rsum : Dans cette communication, nous nous intresserons particulirement aux situations dans lesquelles les documents sont des supports la coordination dun collectif distribu engag dans une activit commune finalise. Aprs avoir dfini la notion de production smiotique rsultant dune transaction communicationnelle symbolique, nous introduirons les stratgies de coordination permettant de pallier la distribution spatio-socio-temporelle de ces transactions. Parmi ces stratgies, nous tudierons plus en dtail la stratgie de documentarisation qui consiste prenniser le support matriel de la transaction et le doter dattributs permettant sa rexploitation. Ltude des processus de documentarisation nous conduira introduire plusieurs notions : la distinction transcription vs enregistrement, la double articulation documentaire externe vs interne du document, les liaisons implicites et explicites entre les fragments du document. Ces notions nous permettrons de dfinir prcisment les Documents pour lAction (DopA) et leurs caractristiques. Lactivit dannotation sera dfinie comme une activit permettant darticuler des fragments documentaires sur des DopA pour soutenir efficacement les activits coopratives. Cette vision nous permettra danalyser un certain nombre de technologies de la coopration et en particulier les forums de discussion comme relevant de technologies annotatives. Nous conclurons en soulignant limportance de la codification dans les processus dinvestissement documentaire et les conditions permettant dy recourir.

Mots cls : Document, Document pour lAction (DopA), Documentarisation, Annotation, Rdaction Cooprative, Forum de discussion.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 139/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

volution du document numrique : un point de vue conomicogestionnaire, CSCW et ingnierie des connaissances Lessor du Web dans un contexte internet ou intranet a entran une multiplication des pratiques collectives centres sur le document, que celles-ci soient de nature strictement professionnelles (conception mdiatise par des plans et des contrats, prise en charge mdicale ou mdico-sociale par un rseau de sant, par exemple), ou quelles soient moins structures (activit dassociations militantes ou de communauts dintrts partageant une passion commune). Toute une srie de nouvelles pratiques centres sur le document sont ainsi en train dmerger, allant de la mise disposition de documents dans des petits systmes de gestion documentaire amens constituer des microbibliothques numriques partages par une quipe, lutilisation des annotations accompagnant la circulation ou la rdaction collective du document, en passant par lusage des Wiki et Blog. Pour rendre compte de la multiplicit de ces pratiques et du caractre la fois collectif et volutif des documents ou collections en cours de rdaction, nous avions propos de dfinir la notion de Document pour lAction (DopA, Zacklad 2003c). Ceux-ci possdent un certain nombre de caractristiques (inachvement prolong, prennit, fragmentation, rapport non trivial aux auteurs, rapport non trivial aux lments du signifi) qui questionnent plusieurs titres les nouvelles thories du document et notamment la problmatique de la gestion de son cycle de vie, compte tenu du fait que son existence publique peut commencer avant quil soit achev, et quil est en mesure de rassembler de nouvelles contributions sous la forme dannotations aprs avoir t stabilis dans une premire version. Dans cette communication, nous nous intresserons particulirement aux situations dans lesquelles les documents sont des supports la coordination dun collectif distribu engag dans une activit commune finalise. Dans ces contextes, le document apparat comme un ensemble de fragments ports par des auteurs divers dont le contenu final reste largement indtermin alors mme que sa circulation rapide lui fait dj jouer un rle majeur dinformation, daide la dcision et de preuve. Nous suivrons le plan suivant : aprs avoir dfini la notion de production smiotique rsultant dune transaction communicationnelle (Zacklad 2005a) entre un ou plusieurs ralisateurs et un ou plusieurs bnficiaires, nous introduirons la problmatique de la distribution spatio-sociotemporelle de ces transactions, qui implique la mise en place de stratgies de coordination permettant leur prservation. Parmi ces stratgies, au nombre de huit, nous tudierons plus en dtail

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 140/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

la stratgie de documentarisation qui consiste prenniser le support matriel de la transaction et le doter dattributs permettant sa rexploitation. Les progrs de la numrisation renforcent cette stratgie par une stratgie complmentaire correspondant lintensification du recours aux quipements techno-informationnels. Ltude des processus de documentarisation nous conduira introduire plusieurs notions : la distinction transcription vs enregistrement, la double articulation documentaire externe vs interne du document, les liaisons smantiques mcaniques et organiques entre les fragments du document. Ces notions nous permettrons de dfinir prcisment les DopA et leurs caractristiques. Nous verrons en particulier quils constituent un dispositif pour la mise en place de transactions communicationnelles mergentes distribues. Lactivit dannotation sera dfinie comme une activit permettant darticuler des fragments documentaires sur des DopA et donc comme contribuant au soutien des activits coopratives quils mdiatisent. Nous conclurons en soulignant limportance de la codification dans les processus dinvestissement documentaire, particulirement pour les documents numriques et les conditions permettant dy recourir.

Une dfinition communicationnelle et pragmatique des concepts de document et de production smiotique

Hyperdaction, hyperfragmentation

Le point de vue spcifique qui est le ntre largit la perspective documentaire bien que celleci se soit dj, travers bon nombre de ses auteurs (cf. par exemple, Brown & Duguid 1995, Briet 1951, Buckland 1997, Pdauque 2003), mancipe dun rapport trop exclusif aux textes classiques . Elle le fait en sancrant rsolument dans une perspective communicationnelle et pragmatique, elle-mme appuye sur le cadre thorique des transactions communicationnelles symboliques (Zacklad 2005a), qui vise rendre compte des activits coopratives, notamment mdiatises par divers artefacts symboliques, dans une perspective la fois communicationnelle, cognitive et socio-conomique. Si nos rflexions visaient clairement lorigine des documents dabord produits et diffuss au sein dorganisations professionnelles dont lactivit est assez prcisment finalise et ce dans le contexte spcifique de la numrisation gnralise qui permet des relations fluides entre intranet et internet, nous pensons quelles peuvent galement sappliquer lensemble des formes de

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 141/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

documents jusqualors traits par les sciences de linformation, dont les finalits sont le plus souvent culturelles au sens large. Pour spcifier les systmes dinformation de nature documentaire qui vhiculent les documents en permettant leur conception (p.e. rdaction) et leur exploitation (p.e. lecture) et qui correspondent aux usages trs divers dinternet au dbut du troisime millnaire (circulation acclre des fichiers via la messagerie, gestionnaire de contenu pour les sites web, forum de discussion, annotation en ligne, weblogs) il nous a sembl ncessaire de contribuer une redfinition du concept de document et de manire corollaire des concepts qui apprhendent les contenus de ces documents, lesquels relvent de moins en moins de la catgorie du texte classique, pour inclure des images et des sons accessibles partir de systmes de navigation de nature de plus en plus varie. Mais surtout, avec la progressive maturation des pratiques dinternet, on assiste une multiplication des usages collectifs des documents numriques, notamment lors de leur phase de production. Les consquences de ces processus de conception collective et en particulier dune conception prolonge sur la dure, pour lapprhension du concept de document, sont sans doute aussi importantes qua pu ltre en son temps la prise en compte dobjets tangibles dans le champ des rflexions bibliographiques (Otlet 1934, Briet 1951) puis celle, plus rcente, induite par la prise en compte de la numrisation gnralise des supports et les modalits de navigation hypertextuelle associes (Buckland 1998, Brown & Duguid 1995, Pdauque 2003). En risquant un nouveau nologisme, nous considrerons quaprs la phase dhyper-lecture rendue possible par les hypertextes, succde une phase dhyper-rdaction dans laquelle les documents pour laction numriss apparaissent eux-mmes comme constitus dune multiplicit dhyperfragments documentaires mouvants dont lunification dpend des activits collectives quils visent soutenir.
Transaction communicationnelle symbolique : la situation transactionnelle

Toute analyse de la notion de document nous semble devoir inscrire ceux-ci dans un processus de communication pour partie diffr, au sens des processus asynchrones dcrits dans le champ du CSCW 141 , entre des producteurs et des rcepteurs lis par des intrts communs. Pour lexprimer dans les termes de la thorie des transactions communicationnelles symboliques, le document est analys comme tant lobjet dune transaction entre des acteurs impliqus dans un
141.

Computer Supported Cooperative Work ou TCAO, Travail Coopratif Assist par Ordinateur.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 142/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

processus dchange visant la fois des engagements mettant en jeu leur self et des connaissances lies la production dune uvre au moins pour partie commune (Zacklad 2004). Comme nous le dcrivions dans le contexte plus restreint de la thorie des transactions intellectuelles (Zacklad 2000), les transactions mdiatises par des objets documentaires peuvent apparatre comme des pseudo-transactions artfactualises au sein desquelles le support de la transaction communicationnelle est de nature prenne. La transaction peut concerner des acteurs singuliers ou, dans certains contextes, viser une audience plus large dont les membres ne sont pas dnomms individuellement, la transaction prenant alors un caractre universalisant. Les documents associs, qui taient alors exclusivement analyss comme concernant des crits, pouvaient tre qualifis dcrits chauds, tides ou froids, selon que les engagements associs la transaction conservaient ou non un caractre actif 142 . Mais lcrit nest quune des matrialisations possibles de lobjet de la transaction. Pour analyser plus prcisment les spcificits du document parmi lensemble des objets smiotiques qui participent des procs de communication, il est ncessaire de se replacer dans le contexte plus large de lanalyse du fonctionnement des transactions communicationnelles dont les supports peuvent tre aussi varis que la posture, le geste ou la voix pour ne citer que les plus frquents. Dans ce contexte largi, nous considrerons que lobjet de la transaction est une production smiotique labore par un producteur pour un bnficiaire dans une situation transactionnelle que nous dcrivons ici spcifiquement sous un angle communicationnel 143 . Les composantes de la situation transactionnelle (qui peut elle-mme se dcomposer dans certains cas particuliers en situation de production smiotique et situation de rception) comprennent :
un ou plusieurs ralisateurs ; un ou plusieurs bnficiaires
142.

144

On notera que le caractre plus ou moins actif de la transaction dont tmoigne le document nest pas li son anciennet comme le montre lextrme vivacit du rapport aux textes dit sacrs pour certaines communauts. 143. Le fait de se focaliser ici sur la dimension smiotique des objets produits lors des transactions ne doit pas faire oublier le fait quil ont galement dautres dimensions, notamment matrielles. 144. Il ne nous est pas possible de dvelopper ici les raisons pour lesquelles nous utilisons les concepts de producteur et de bnficiaire au lieu, par exemple, des concepts dmetteur et de rcepteur utiliss dans le modle shanonien classique. Signalons simplement que la vision mathmatique de linformation laquelle se rfre ce modle est trs loigne de la vision anthropologique des objets smiotiques sur laquelle nous nous basons. Quand le terme de rception est utilis pour dcrire les situations ou les bnficiaires prennent connaissance du mdia et de son contenu il se rapproche davantage du concept de consommation que de celui denregistrement au sens informatique du terme.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 143/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

des paramtres de la situation transactionnelle au sens o le terme situation ou de contexte est utilis dans le domaine de lanalyse pragmatique de la communication (Kerbrat-Orecchioni 1990), qui relvent pour nous des domaines suivants : un projet commun sur la base dintrts ou dobjectifs pour partie partags qui justifient la participation cette situation collective. Comme dans les analyses de la conversation on pourra distinguer entre le but global de la transaction et les buts ponctuels (Kerbrat-Orecchioni 1990) qui correspondent pour nous des microtransactions communicationnelles ; des relations sociales entre le ralisateur et le bnficiaire dont dcoulent pour partie les intrts ou objectifs communs poursuivis. Parmi ces relations certaines sont structurelles et dpendent des statuts sociaux des participants, dautres sont directement lies la transaction en cours, aux intrts courants et aux rles interactionnels ; un cadre spatio-temporel (setting) et des conditions environnementales contingentes susceptibles dinfluencer tant latteinte des objectifs que le processus de production smiotique ; le choix dun mdium en fonction, notamment, des contraintes imposes par le cadre spatio-temporel et les conditions environnementales. Le mdium se dcompose lui-mme dans le choix dune modalit dexpression (langagire orale, scripturale, gestuelle, filmique, etc.) et sur le choix dun support matriel associ ce mdium quand plusieurs options sont possibles (modalits de vocalisation, nature du support pour un mdium scriptural, etc.) ; des quipements techno-informationnels (artefacts) disponibles dans le cadre spatio-temporel et qui offrent (1) des reprsentations externes des buts (2) des ressources documentaires contribuant alimenter la production smiotique et (3) des supports prennes associs au mdium et facilitant la circulation et le partage de celui-ci. Ces quipements sappuient sur du matriel de bureau et de la documentation papier ou exploitent des technologies numriques qui permettent alors de proposer des fonctionnalits plus ou moins automatises. Dans tous les cas ils exercent une influence majeure sur le choix des mdias et lactivation des reprsentations individuelles et communes. Ils peuvent requrir des comptences spcifiques de la part des participants pour tre mis en uvre. les terrains reprsentationnels commun (Clark 1996) et individuel des participants correspondant lensemble des reprsentations voques durant la transaction issues (1) des comptences et (2) des autres paramtres de la situation transactionnelle (modalits de partage du cadre spatio-temporel et daccs aux quipements techno-informationnels notamment) qui influencent en particulier les

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 144/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

souvenirs de lhistoire de la transaction (voir la note 5 sur la notion de reprsentations communes par rapport aux notions de croyances communes, connaissances communes, etc.) ; les comptences des ralisateur(s) et bnficiaire(s) lies la situation au sens large et lactivit communicationnelle leur permettant pour les uns, de raliser une production smiotique sur un mdium donn et pour les autres, de recevoir ce mdium et cette production. Les comptences peuvent porter sur des domaines divers et concernent notamment les procdures permettant la ralisation de la production smiotique. Dans les situations dinteraction en face face, o il y a principalement coproduction smiotique, ces comptences qui interviennent dans la production, la mmorisation et le rappel des reprsentations individuelles et collectives permettent la synchronisation cognitivo-motionnelle des participants ; enfin une (co)production smiotique 145 en cours dlaboration vhiculant un contenu smiotique via un mdium labore par les ralisateurs lintention des bnficiaires et qui est elle-mme le moyen de lactualisation et de la transformation de la situation transactionnelle (projet commun, relations sociales, comptences, reprsentations).
Processus de production et de coproduction smiotique

La comprhension du processus de production smiotique ncessite de sappuyer sur une analyse hirarchique de lactivit qui mobilise diffrents niveaux dinterprtation. Pour atteindre le projet global qui justifie la transaction, les participants sengagent dans une srie de soustransactions communicationnelles dans lesquelles un participant est en position de ralisateur et lautre de bnficiaire. Cette position est ensuite susceptible de sinverser, le bnficiaire reprenant linitiative de lchange. Cette sparation nest elle-mme tenable qu un niveau danalyse suffisamment gnral : dans le cas du face face, lnonciation est elle-mme influence par la rception du bnficiaire (Kerbrat-Orecchioni 1990) et les statuts de ralisateur et de bnficiaire peuvent tre assimils des statuts de contributeur principal et contributeur secondaire la production smiotique commune. Selon que lon souhaitera mettre laccent sur les rles potentiellement dissymtriques ou symtriques des acteurs relativement une production ou une sous-production smiotique, symtrie qui tient elle-mme souvent au degr de synchronie temporelle, on parlera de ralisateur vs bnficiaire dune production smiotique ou de contributeurs symtriques dune coproduction smiotique.
145.

Quand la transaction est fortement standardise et que sa production est trs codifie on parle de production informationnelle .

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 145/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

La production smiotique globale issue dune transaction communicationnelle apparat donc comme le rsultat de microproductions smiotiques. Corollairement, au niveau le plus fin de dcomposition, on considrera que la transaction communicationnelle est compose de microtransactions communicationnelles correspondant des actes de langage lmentaires 146 . La dcision de clture de la transaction communicationnelle globale appartient aux participants. Cest essentiellement un acte dofficialisation de laccord cognitivo-motionnel auquel ils sont parvenus (Zacklad 2005c). Cet acte dofficialisation est particulirement important dans linstitution du passage de la parole au texte (Taylor et alii, 1996) ou plus gnralement de la production smiotique au document. La contribution des sous-productions smiotiques la production smiotique principale est complexe tablir. Dans certains cas, il est possible de sparer une dcision finale des arguments ayant permis dy parvenir. Dans de nombreux cas, certaines propositions sont rejetes au profit dautres, soit que le contributeur lui-mme les abandonne, soit quelles soient rejetes lissue dun dbat de manire plus ou moins explicite. La contribution de ces propositions laccord final, mme quand elles sont considres comme non pertinentes, peut ne pas tre ngligeable et la question de savoir la place quil faut leur accorder dans les comptes rendus , quand ceux-ci sont raliss, toujours difficile trancher. Notons que le fait de parler de coproduction smiotique ne signifie pas que lun des participants ne puisse tre tenu pour lauteur ou le responsable principal de celle-ci. De mme quil est possible dtablir une distinction entre les contributeurs principaux et secondaires dune microproduction smiotique, il est galement possible de dfinir le ou les contributeurs principaux de la production smiotique globale. Dans certains cas, relation client-fournisseur contractuelle, par exemple, cette distinction est un prsuppos majeur de la transaction : mme si le client coproduit, coopre, la responsabilit de la conduite de la transaction et la validation des productions appartiennent au fournisseur. Dans dautres cas, travail dcriture personnel , lauteur principal est souvent manifeste et laccord qui valide la production smiotique et donc loffre de transaction communicationnelle, est ralis lors de lactivit de lecture et dinterprtation
146.

On raisonnera en conformit avec la pragmatique linguistique qui tablit galement une distinction entre des macro-actes de langage (qui correspondraient la transaction communicationnelle globale) qui englobent plusieurs micro-actes de langages (voir, par exemple, Kerbrat-Orecchioni, 2001).

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 146/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

du lecteur qui fait suite lacte dacquisition de louvrage 147 . Dans certains genres, comme dans les productions acadmiques, les cocontributeurs indirects au projet global font lobjet de citations. Dans le travail collectif, les configurations sont parfois intriques. Par exemple, deux coralisateurs dune production smiotique peuvent agir comme fournisseurs dun ou plusieurs clients bnficiaires de celle-ci. Il y a un premier niveau de coproduction qui peut tre symtrique (responsabilit considre comme quivalente sur les contributions) entre les coralisateurs et un second niveau de coproduction, celui-ci asymtrique entre les co-ralisateurs et les bnficiaires. La production smiotique peut avoir t propose comme production smiotique globale par les coralisateurs mais rejete en ltat par le ou les bnficiaires. On se trouve alors dans une situation intermdiaire opposant la communaut des ralisateurs validant pour elle-mme la production smiotique celle des bnficiaires dun avis contraire. Cet exemple montre que la pertinence dune production smiotique, pertinence qui permet de la considrer comme le rsultat achev dune transaction communicationnelle globale, est toujours relative aux situations transactionnelles de rfrence et aux accords des participants celle-ci.
Composantes des productions smiotiques

Dans lanalyse de la production smiotique on pourra tablir une distinction entre dune part, la forme et le support de cette production, ou mdium de la production smiotique, et dautre part, le contenu smiotique vhicul par ce mdium. On verra dans la suite de lanalyse que nous considrons les documents comme des productions smiotiques mdiatises par des supports prennes dots de proprits spcifiques. La production smiotique se compose donc :
du mdium qui peut lui-mme tre analys, comme on la vu plus haut, selon deux paramtres : le choix dune modalit dexpression (langagire orale, scripturale, gestuelle, filmique, etc.), au sein de laquelle est conventionnellement dtermin un systme de signes permettant des agencements syntagmatiques et paradigmatiques ;
147.

On tablit bien ici une discussion entre la production smiotique et laccord qui valide celle-ci en la considrant comme pertinente pour le collectif. Dans une situation de coprsence, laccord se ngocie simultanment la production ellemme. Dans une cordaction dans le cadre dun projet ou dans une publication scientifique, celui-ci fait lobjet dun protocole plus ou moins formel. Dans la production dune uvre artistique, cest la dcision de lditeur ou de lexposant mais surtout la rception par le public qui valide ou invalide la transaction communicationnelle globale et donc la production smiotique dans son statut duvre.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 147/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

le choix dun support matriel associ cette modalit dexpression et adapt ses caractristiques (vocalisation, gestes, support papier ou lectronique pour un mdium scriptural, etc.) ; du contenu smiotique (ou signification) qui peut lui-mme tre apprhend de deux manires en fonction de : son pouvoir dvocation qui est sa capacit voquer des reprsentations commune
148

en fonction (I) de lagencement des signes conforme aux

possibilits offertes par le mdium et (II) des paramtres de la situation transactionnelle (le pouvoir dvocation correspond une des facettes traditionnellement tudie par la smantique). Dans certaines situations extrmement standardises les signes nvoquent pas de reprsentation mais dclenchent directement des automatismes et lon considrera que les dimensions matrielles et communicationnelles de la transaction se confondent (cf. infra) ; ses effets potentiels psychiques et sociaux qui correspondent aux consquences possibles de lvocation de certaines reprsentations qui permettent dattester de leffectivit de la communication. Ces effets sont plus ou moins prvisibles selon le degr de standardisation de la situation transactionnelle et portent notamment sur lactualisation du terrain commun et llargissement du contenu smiotique tabli entre les participants, considr comme ayant publiquement ou officiellement fait progress la transaction
149

(les effets potentiels correspondent

une des facettes traditionnellement tudie par la pragmatique linguistique).

On remarquera que ces dfinitions diffrencient au sein du mdium, le choix de la modalit dexpression de celui du support matriel associ cette modalit dexpression, une distinction qui aura son importance pour lanalyse du document.

148.

La notion de reprsentation commune correspond pour nous la notion de terrain commun au sens de Clark 1996. Selon Clark (cf. p 94), qui sappuie sur Lewis 1969, la notion de terrain commun correspond linformation possde ( has information ) par les participants, expression qui subsume les catgories de croire, connatre ( know ), assumer, ou tre conscient, qui elles-mmes renvoient aux notions techniques de croyance mutuelle, connaissance mutuelle, assomption mutuelle, et conscience mutuelle. La notion de reprsentation commune , plus proche de la psychologie cognitive, pour nous lavantage de faire rfrence aux processus cognitifs dactivation reconstructive de linformation dans le cadre de transactions communicationnelles. La notion de connaissance commune renverrait davantage pour nous la notion de communal common ground , dinformation partage par des communauts largies garantes de leur prennit notamment par le biais de diffrents. 149. Correspondant la notion de Discourse Record chez Clark.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 148/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Distribution des transactions dans un cadre spatio-socio-temporel htrogne

Du fait de la distribution des activits collectives, ralisateurs et bnficiaires des transactions communicationnelles peuvent ne pas tre prsents dans le mme cadre spatio-temporel. Cela implique de donner une forme prenne aux objets de la transaction de manire ce quelle puisse tre initialise, interrompue, ractualise, rpte, dans toutes les configurations de prsence ou dabsence du bnficiaire et du ralisateur. Par ailleurs, dans certains contextes, des ralisateurs distants peuvent se substituer aux ralisateurs ayant initi la transaction en jouant leur rle . Dans ces contextes frquents dans les organisations complexes et le monde conomique nous parlerons de distribution spatio-socio-temporelle des transactions. Dans la thorie socio-psycho-conomique largie des activits transactionnelles que nous sommes entrain dlaborer, les mdias qui sont produits et changs dans les transactions nont pas quune dimension smiotique. Si les objets produits par les acteurs sont considrs comme des mdias, cest avant tout parce quils mdiatisent les relations entre les acteurs en leur confrant un caractre transactionnel. Le fait quils vhiculent une signification nest quune de leur caractristique majeure. Lautre dimension importante des mdias est leur dimension matrielle qui fait rfrence des effets relevant dun ordre plus corporel ou sensoriel que psychique (ce dernier terme regroupant des dimensions cognitives et affectives ou sentimentales). Bien que les deux composantes soient toujours prsentes, puisque le mdium a galement recours un support matriel, quand les effets smiotiques prdominent sur les effets matriels du mdium, comme cest le cas pour une production langagire quelle soit orale ou scripturale, nous parlerons de mdium smiotique par opposition aux mdias matriels, ou objets, dans lesquels lautre dimension prdomine 150 . Les mdias symboliques ont aussi une dimension matrielle qui correspond aux effets marginaux exercs par leur support sur les organes sensoriels. La
150.

En ce qui concerne les mdia matriels ou objets nous tablissons une classification traditionnelle selon leur nature immobilire (btiment, espace partag), mobilire (vtement, meuble), consommable (aliments, carburant), technique (machine).

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 149/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

prennisation des supports autorisera aussi une extension de la fonction smiotique qui sera, comme nous le verrons, exploite dans le processus de documentarisation. Dans le contexte des transactions dont la production, principalement smiotique, repose sur des mdias symboliques (transactions communicationnelles), il existe diffrents moyens permettant de distribuer la transaction dans un contexte spatio-socio-temporel htrogne. Nous en prsenterons ici huit, la (1) normalisation de la situation transactionnelle, (2) la formalisation de lexpression, (3) la ritualisation mnmotechnique, (4) labstraction, (5) la mdiation substitutive, (6) la documentarisation, (7) lintensification du recours aux quipements technico-informationnels et la (8) coordination substitutive. Ces diffrents moyens ne sont pas compltement indpendants les uns des autres et se renforcent souvent. Dans le contexte de transactions impliquant principalement des mdias matriels, dautres stratgies comme lautomatisation, la formalisation des dimensions ou la conservation sont mises en place pour assurer leur distribution.
Huit stratgies de coordination des transactions communicationnelles distribues

1. La normalisation de la situation transactionnelle consiste jouer sur les paramtres de la situation transactionnelle, homognisation des caractristiques des acteurs en prsence, reproduction des objectifs, des relations sociales, des comptences, du cadre spatio-temporel, des conditions environnementales, des quipements technico-informationnels, des procdures, de manire encourager la gnration de productions smiotiques similaires dans un cadre spatiosocio-temporel distribu. 2. La formalisation de lexpression consiste travailler sur cette composante du mdium de manire stabiliser le contenu smiotique. Elle sexerce dans les dimensions syntagmatiques et paradigmatiques. Dans le premier cas, elle vise fixer prcisment les conditions dagencement des signes composant la production smiotique par la dtermination dun ensemble de contraintes denchanement. Dans le second cas, elle vise positionner dans un rseau smantique lensemble des signes quivalents ou proches et la nature de leurs associations en fonction de leurs ressemblances, de leur pouvoir dvocation et de leurs effets potentiels dans une situation transactionnelle donne. Le dveloppement de langages de spcialit dans diffrents domaines dactivits professionnelles relve directement de cette stratgie. Elle nous intressera particulirement dans le cadre de llaboration dontologies smiotiques .

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 150/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

3. La ritualisation mnmotechnique relve des stratgies de mmorisation des participants sur les plans sensori-moteurs et psychiques. Elle exploite directement la normalisation de la situation transactionnelle et la formalisation de lexpression ; elle influence les mthodes utilises par les acteurs pour raliser et recevoir la production smiotique, en particulier pour la ractiver dans un contexte spatio-socio-temporel diffrent (cf. notamment Bachimont 2004, pour le rle du corps dans les pratiques mnsiques). Si la ritualisation mnmotechnique sinstalle pour une large part linsu, des sujets elle relve dans dautres cas de la mise en place de sessions de formation, de lapprentissage volontaire dune terminologie et de ses rgles demploi, de la diffusion rpte de slogans visant marquer les esprits Dans un contexte organisationnel complexe elle portera, par exemple, sur la mmorisation des procdures ou sur le nom des acteurs impliqus dans tel ou tel processus. 4. Labstraction consiste travailler sur le contenu smiotique lui-mme pour systmatiser les points de vue qui sy expriment. Elle consiste dvelopper un niveau de discours thorique ou doctrinaire plus universalisant , afin de faciliter la transposition des transactions communicationnelles dans des situations dont la structure de surface (Zacklad 2004) diffre, mais qui possdent nanmoins des analogies en profondeur. Le dveloppement de principes mthodologiques abstraits, par opposition aux procdures relevant dune mthode applique, est un exemple du recours labstraction. 5. La mdiation substitutive agit sur le mdium de la production smiotique. Mais au lieu dinfluencer la modalit dexpression et sa formalisation, elle consiste travailler le support matriel (ce qui en retour ne sera pas sans consquences sur la modalit dexpression). Elle substitue la perception directe de la production smiotique partir du corps du sujet ralisateur une modalit de perception indirecte par le biais dune transcription sur un support dcriture ou du codage automatique dune des sources physiques qui vhicule les signaux constituant la production smiotique sur un support diffrent. Le support matriel peut-tre class selon quil est de nature phmre ou prenne. Les supports phmres sont caractriss par le fait que les stimuli quils vhiculent ne peuvent exercer quun effet transitoire sur les organes des sens des rcepteurs notamment du fait que la forme donne au support ne marque pas celui-ci de manire prenne (cest le cas de lair qui est le support phmre de la parole ou des flux lumineux qui renseignent linterlocuteur sur les gestes de son partenaire dans une interaction de face face).

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 151/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Par contraste, les supports prennes conservent la forme donne au support ce qui permet au destinataire de ritrer leffet exerc par la forme sur ses organes des sens. Quand il contrle ces supports, le destinataire peut grer les conditions dans lesquelles les stimuli sont rendus accessibles ses organes sensoriels dans des intervalles de temps courts (relire de quelques lignes ou revoir un extrait de film sur un support numrique personnel) ou longs (reprendre un document aprs plusieurs jours, semaines, annes). Il existe trois procds utiliss dans la mdiation substitutive : la transcription, le codage automatique dune source physique et lenregistrement des productions smiotiques codes. Ces procds permettent de transmettre distance les productions smiotiques et dans certains cas de les conserver de manire prenne. La transcription relve des pratiques de lcriture et repose sur un code graphique qui doit tre matris par le rdacteur comme par le lecteur. Le codage automatique dune source physique convertit une forme physique associe une modalit dexpression pour la transmettre plus aisment sur un autre support avant de la dcoder pour la restituer son destinataire. Lenregistrement permet de conserver les signaux physiques cods sur des supports prennes. Le codage automatique dune source physique peut transmettre distance une production smiotique sans que le support de la transmission ne soit prenne ni du ct du ralisateur ni du ct du bnficiaire comme dans le cas dune conversation tlphonique. Dans certains cas de retransmission radiophonique diffre dun vnement enregistr, le support est prenne pour le ralisateur mais pas pour le bnficiaire. En slectionnant une source physique associe une modalit dexpression (voix, donnes, image, kinesthsie), la mdiation substitutive appauvrit souvent la production smiotique par rapport au potentiel disponible dans les situations de face face (absence de la redondance offerte par la multimodalit). Parfois, elle offre lavantage de mettre en relief certains attributs supposs possder une pertinence particulire. Enfin, elle peut, notamment dans le cas de la transcription, venir doubler les modalits dexpression utilises en coprsence, comme cest le cas lors du dessin de schmas dans une runion. 6. La documentarisation vient prolonger la mdiation substitutive quand les supports utiliss sont prennes. Elle consiste doter ces supports dattributs spcifiques permettant de faciliter (I) leur gestion parmi dautres supports, (II) leur manipulation physique, condition dune navigation smantique lintrieur du contenu smiotique et enfin, (III) lorientation des rcepteurs, mais galement de plus en plus des ralisateurs eux-mmes lintrieur du support en dfinissant une ou plusieurs cartographies des contenus smiotiques susceptibles de guider la navigation smantique.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 152/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Parce quils nous intressent au premier plan dans le cadre de cet article nous voquerons plus bas les diffrents processus de documentarisation. 7. Lintensification du recours aux quipements technico-informationnels, qui prolonge et largit la mdiation substitutive et la documentarisation, vise adapter de manire spcifique les moyens techniques informationnels associs la transaction communicationnelle et la production smiotique. Les quipements technico-informationnels servent trois principales fonctions : (1) ils fournissent des reprsentations externes des buts, de lorganisation et de la procdure (2) ils offrent des documents ressources distincts de la production smiotique mais qui contiennent des informations permettant de lalimenter (3) ils facilitent la gestion du support de la production smiotique et notamment des liaisons organiques entre ses fragments (cf. infra) en facilitant son partage et sa diffusion. Ils sont eux-mmes bass sur des supports techniques permettant la gestion et la cration de documents papiers (armoire, ouvrage, classeur, matriel de bureau) ou numriques, en exploitant les technologies de linformation et de la communication. Voici quelques exemples montrant comment ladaptation de lquipement technico-informationnel peut venir renforcer les autres stratgies de coordination :
Normalisation de la situation transactionnelle : mise disposition dune reprsentation externe et de procds de manipulation de cette reprsentation pouvant porter sur le but, lorganisation ou la procdure. Cette reprsentation peut tre sous forme papier ou numrique et peut tre complte par des ressources documentaires spcialises adaptes la rsolution des problmes traits durant les transactions. Dans certains cas cette reprsentation externe est un construit symbolique permanent intgr aux procdures de coordination des acteurs et constituant un mcanisme de coordination comme les systmes de Kanban ou les tableaux daffichage tudis par C. Simone et K. Schmidt (1996). Quand les mcanismes de coordination sont informatiss, ils relvent alors de la coordination substitutive. Formalisation de lexpression : mise disposition de systmes de type liste ou dictionnaire adapt la transaction sous forme papier ou numrique. Ritualisation mnmotechnique de la transaction : idem que pour les deux prcdents pour faciliter la mmorisation. Abstraction du contenu smiotique : documents dcrivant la formalisation des points de vue et des concepts ou guide mthodologique adapt la transaction. Mdiatisation substitutive : quipement de tlcommunication paramtr pour la situation transactionnelle.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 153/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Documentarisation : systme de navigation et de classement permettant dorganiser progressivement les fragments de production smiotique et leurs supports selon la situation.

8. La coordination substitutive rsulte de lautomatisation du fonctionnement des quipements technico-informationnels. Dans certaines situations trs standardises lautomatisation de la procdure et la numrisation du support de la production smiotique donnent lieu la mise en place de systmes transactionnels quasi-automatiques (p.e. rservation en ligne via internet) bass sur des modles de workflow 151 . Dans ces cas particuliers la transaction devient principalement informationnelle, ce qui correspond pour nous une double transformation : (1) une rduction de la dimension interactionnelle et de lengagement social des acteurs, (2) une rduction de la dimension symbolique du contenu smiotique au profit dune formalisation machinale de lexpression et deffets potentiels standardiss 152 (Zacklad 2005b). Dans ces cas de transformation radicale de la nature de la transaction linformatisation/automatisation ne relve plus des stratgies de coordination des transactions communicationnelles distribues mais de mcanismes substitutifs propres aux transactions informationnelles. Dans le contexte des activits coopratives qui nous intressent ici au premier plan et dans lesquelles la standardisation npuise pas le potentiel communicationnel, la coordination substitutive relve des travaux raliss dans le champ du CSCW (Computer Supported Cooperative Work) ou de lIngnierie des Connaissances. En lien avec les fonctions remplies par les quipements technico-informationnels, la coordination substitutive va, par exemple, contribuer (1) lautomatisation de certaines tapes du protocole de coordination 153 (par exemple, alerte automatique des acteurs selon ltat de la production smiotique), (2) lautomatisation de certaines recherches dinformation selon les besoins dtects (3) ou lindexation des liaisons entre les fragments de la production smiotique selon sa progression. Par exemple, certains projets relevant du CSCW contribuent au dveloppement de fonctionnalits de coordination substitutive soit en se basant sur lanalyse de lactivit des acteurs
151. 152.

On se situe alors dans le cadre des mcanismes de coordination automatiss dcrits par C. Simone et K. Schmidt (1996). Une transaction informationnelle pourrait tre considre comme matrielle mais la matire produite na pas de valeur nergtique intrinsque et renvoie un code prtabli. Ces transactions visent souvent alimenter des registres ou des bases de donnes qui jouent un rle important dans la coordination mais pas dans la communication au sens fort, qui implique une coconstruction de la situation, un engagement et une dimension symbolique. Notons quune interaction interpersonnelle sans engagement a galement une valeur plus informationnelle que communicationnelle. Par contre, une activit de production smiotique ralise dans lisolement, mais possdant un fort potentiel interprtatif (ou symbolique), sera considre comme communicationnelle cause de lengagement de son auteur et du travail dinterprtation personnel important requis de la part des bnficiaires potentiels. 153. Au sens de Schmidt et Simone, 1996.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 154/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

distribus de la transaction (systmes de support la conscience mutuelle, Heath & Luff, 1992, Dourish & Belotti, 1992), soit en exploitant des lments de formalisation de la production smiotique (approche du Web Smantique. Tim Bernes Lee et alii 2001). Notre analyse de la notion de Document pour lAction vise notamment faciliter la mise en place de stratgies de coordination bases sur le recours aux quipements technico-informationnels et quand cela apparat pertinent, de coordination substitutive.
Stratgie de coordination Normalisation de la situation transactionnelle lments directement impacts (en complment de la production smiotique et de ses effets) Normalisation des buts, des relations, de lorganisation, des tapes de la production (procdure), de lenvironnement spatio-temporel, du mobilier, des documents ressources, des quipements technico-informationnels offerts Mmoire des participants dans ses dimensions sensori-motrices et psychiques Forme de lexpression Autres dimensions impactes

Ritualisation mnmotechnique du droulement de la transaction

Ritualisation mnmotechnique de la transaction Formalisation de lexpression de la production smiotique Abstraction du contenu smiotique

Contenu smiotique

Mdiatisation substitutive

Documentarisation

Support matriel du mdium (support prenne) ou accs distant certains attributs des selfs : voix, image (codage automatique dune source physique) Support matriel du mdium

Modalit doccupation de lespace et de gestion du temps, usage des quipements technicoinformationnels Documentarisation, abstraction du contenu smiotique, usage des quipements technicoinformationnels Indpendance vis--vis des paramtres de la situation transactionnelle, formalisation de lexpression, usage des quipements technicoinformationnels Forme de lexpression, accs commun la production smiotique Accs commun la production smiotique, modalit du recours aux quipements technicoinformationnels Normalisation de la situation transactionnelle, ritualisation mnmotechnique, documentarisation

Intensification du recours aux quipements technicoinformationnels Coordination

Inscription des dimensions socioorganisationnelles, accs rapide aux documents ressources, meilleure gestion des fragments de la production smiotique Automatisation de certaines

Idem que pour lintensification du

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 155/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

substitutive

composantes de la procdure, des fonctions de recherche dinformation et de gestion du support de la production smiotique

recours aux quipements technicoinformationnels en plus impactant

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 156/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Processus et moyens de la documentarisation

Transcription et enregistrement

Comme nous lavons dit en introduction, nous nous arrterons particulirement dans le cadre de cet article sur la stratgie de documentarisation et la manire dont certains quipements technicoinformationnels seront en mesure de lassister. Deux grandes mthodes permettent aujourdhui de vhiculer une production smiotique sur un support prenne, la transcription et lenregistrement. La premire sappuie sur la reproduction sur le support de signes graphiques dans des logiques de figuration ou dquivalence phontique, par exemple. Les signes graphiques codifis les plus utiliss sont ceux qui sont utiliss dans les trs nombreux systmes dcriture produisant des textes . Alors que la transcription implique le recours un systme de signes spcifiques, et donc la transposition du contenu smiotique selon une modalit dexpression nouvelle qui nest pas sans consquence sur son pouvoir dvocation et ses effets potentiels, lenregistrement peut sembler avoir des effets moins marqus sur les contenus smiotiques faisant lobjet des transactions. Mais cette diffrence est peut-tre moins profonde quil ny parat. En effet, si le recours la transcription possde un cot initial qui peut sembler plus important que celui de lenregistrement, celui-ci prsente le risque doffrir une quantit de matriel considrable et difficile exploiter et donc dtre plus difficile documentariser notamment en ce qui concerne la cartographie des contenus smiotiques vhiculs sur le mdium. la fois pour des raisons defficacit de la transaction et de documentarisation, lenregistrement sappuie souvent sur des stratgies de mise en scne et de montage des microtransactions que lon souhaite prenniser. Ainsi, de mme que la transcription ne laisse pas le contenu smiotique inchang, lenregistrement, qui pour tre efficace doit tre slectif, transforme galement ce contenu par rapport son expression dans des contextes synchrones sur supports phmres. Enfin, de nouveaux supports hybrides et complexes ne cessent dapparatre dans le contexte de la numrisation, dans laquelle le support ne sert plus seulement, par exemple, reconstituer des textes en leur donnant une apparence aussi proche que possible de celle quils pouvaient avoir sur le papier, ou traduire sous la forme dicnes un langage de commande, mais galement mettre en scne des situations transactionnelles dans le cadre dinterfaces de ralit virtuelle qui tout en pouvant donner limpression de rsulter dun enregistrement, sont en fait des constructions

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 157/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

entirement artificielles dans lesquelles de nouvelles modalits dexpression des contenus smiotiques sont dfinies.
Dfinition du document et de la double articulation documentaire externe/interne

Mais on la vu, la transcription ou lenregistrement sont des conditions ncessaires mais non suffisantes de la documentarisation. Une prise de note personnelle ou un enregistrement ponctuel visant faciliter une activit smiotique dans une situation transactionnelle donne pourront avoir une utilit locale certaine. Cependant, sils ne font pas lobjet dun investissement documentaire permettant de soutenir les processus de documentarisation, ces supports ne pourront pas tre rexploits dans des situations transactionnelles diffres et distribues. En dautres termes, il est possible de recourir la mdiation substitutive en exploitant des supports prennes par le biais de la transcription ou de lenregistrement sans que celle-ci ne produise des documents au sens prcis que nous souhaitons donner ce terme. En cohrence avec notre dfinition de la stratgie de documentarisation, le document dsignera pour nous une production smiotique transcrite ou enregistre sur un support prenne, qui est quipe dattributs spcifiques visant faciliter les pratiques lies son exploitation ultrieure, dans le cadre de la prservation de transactions communicationnelles distribues. Ces attributs doivent permettre au document de circuler travers lespace, le temps, les communauts dinterprtation, pour tenter de prolonger les transactions communicationnelles inities par ses ralisateurs. Ils contribuent une double articulation documentaire. Comme nous le verrons plus bas, la notion de production smiotique tend exclure, ou du moins mettre la marge du champ documentaire la production de donnes automatises, les transactions associes ces donnes tant considres comme plus informationnelles que communicationnelles. Pour progresser dans lanalyse des stratgies de documentarisation, il est ncessaire de rentrer dans la diversit des pratiques associes, dune part, (I) lexploitation externe du document parmi dautres documents avec lesquels il est stock lintrieur de bibliothques, darchives, darmoire de classement, de base de donnes administratives, techniques ou documentaires de nature diverses (de grande taille ou non, personnelles, prives ou publiques, grant des supports numriques et/ou papiers, regroupant des productions smiotiques plus ou moins htrognes dans leur forme dexpression ou dans leurs genre , etc.) et dautre part, (II) lexploitation interne du document qui regroupe un ensemble de microproductions smiotiques

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 158/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

dont le nombre peut tre trs variable et dont les modalits darticulation peuvent galement tre fort diverses. Pour rpondre aux besoins du premier type dexploitation du document, celui-ci sera dot dun certain nombre dattributs qui permettront son articulation smantique externe avec dautres documents renvoyant des projets transactionnels proches. Ces attributs permettront de dater le document, de le localiser, didentifier les ralisateurs de la transaction (auteurs) ou les types de bnficiaires auxquels il sadresse (lecteurs), de dcrire de manire schmatique son contenu smiotique, etc. Pour rpondre aux besoins du second type dexploitation, on utilisera des attributs qui permettront de dcomposer le document en parties cohrentes (titre, espacements, table des matires), de mettre en relief certaines expressions permettant lorientation smantique du lecteur lintrieur du contenu smiotique (sous-titrage, typographie), de renvoyer le bnficiaire sur dautres parties smantiquement lies (renvois, index, notes). Ces attributs qui relvent de larticulation smantique interne constituent un systme dorientation permettant au bnficiaire de la production smiotique, au lecteur dans le cas dun texte, de naviguer smantiquement lintrieur du document.
Liaisons smantiques implicites et explicites entre les fragments dun document

Lutilisation dun support prenne pour mdiatiser la circulation des contenus smiotiques va galement permettre dinscrire ou denregistrer sur le mme support un nombre trs important de signes et donc potentiellement de transactions communicationnelles distinctes. Derrire un projet transactionnel principal rsum par le titre du document, celui-ci regroupe un nombre important de sous-projets transactionnels correspondant autant de fragments documentaires plus ou moins troitement relis entre eux sans que la diversit de ces sous-projets ne soit toujours explicite. Lenjeu de lorientation smantique du lecteur lintrieur dun document renvoie donc la question complexe de larticulation interne des fragments dont le document est compos ou encore de leur mode de liaison. Les liaisons implicites sont celles qui correspondent lenchanement des fragments dans le texte qui exploite les diffrentes logiques de planification associes au projet transactionnel du ralisateur : temporelle, structurelle, fonctionnelle, etc. Elles exploitent galement toutes les relations de prsupposition autorises par le partage dun terrain reprsentationnel commun, modifi et largi au fur et mesure du droulement de la transaction. Ce dcoupage est la fois celui qui peut

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 159/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

sembler le plus naturel et celui qui semble fournir une logique daccs implicite au contenu smiotique. Le systme dorientation explicite vient doubler le prcdent en fournissant un systme dorientation supplmentaire qui soit, explicite le projet navigationnel initial (sous-titrage et table des matires), soit vient proposer des projets navigationnels a priori plus inattendus (index, tables de rfrence). Dans ce dernier cas, il sappuie le plus souvent sur un ensemble de ressources terminologiques et ontologiques organises selon une logique diffrente de celle de la table des matires , la fois plus gnrale et plus systmatique, ou exploitant un point de vue trs particulier, comme le nom des auteurs cits dans un texte caractre littraire. Sa constitution demande toujours un investissement significatif mais peut confrer au document une valeur ajoute importante correspondant une plus grande polyvalence transactionnelle. Lexploitation de ces deux types de liaisons est le plus naturel dans le cadre de larticulation interne. Mais il est galement possible de retrouver ces logiques dans le cadre de larticulation externe, notamment dans le cas de documents appartenant des collections ou de petits documents regroups dans des dossiers. Ainsi, le projet de collection pourra proposer une liaison implicite entre les volumes , qui pourra tre double par un systme de codification plus explicite, ou par la mise disposition dun thsaurus global permettant une exploitation systmatique de la production smiotique.
Transactions informationnelles et systmes informatiss

La mdiation substitutive et la documentarisation ont connu une extension considrable avec la gnralisation de limprimerie puis avec celle de la numrisation qui correspond elle-mme une explosion des pratiques transactionnelles distribues dans les univers de ladministration, de lconomie, de la politique, de lart et du divertissement, de la science Mais alors que certaines transactions sont longues, complexes, cratives, dautres sont brves, rptitives, automatises. Dans ces dernires que nous considrons comme des transactions communicationnelles standardises ou encore transactions informationnelles, les acteurs ne sont pas engags dans des coproductions smiotiques ouvertes linterprtation mais dans des productions ou coproductions informationnelles. Dans notre acception du terme, linformation est moins investie de subjectivit que les productions smiotiques (moindre engagement des acteurs) et possde une moindre porte symbolique (signification univoque dans la situation transactionnelle de rfrence). Les productions

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 160/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

smiotiques vhicules sur des supports prennes donnent lieu la production de documents par la dfinition dattributs qui faciliteront leur exploitation ultrieure et la gestion de leurs supports. Ces attributs sont notamment issus de lexplicitation de certains paramtres de la situation transactionnelle et de certaines liaisons implicites entre les fragments de la production smiotique. Les productions informationnelles quant elles, peuvent donner lieu des pseudo-documents formulaires 154 quand elles exploitent un support prenne, les attributs du formulaire tant fournis par la simple transcription de paramtres dj explicits de la situation transactionnelle standardise (les champs) et par la slection dune valeur au sein dun ensemble prdtermine. Les transactions informationnelles se droulent, par exemple, lors dun acte dachat automatis, et produisent des donnes standardises qui ne sont pas assimiles des productions smiotiques. Cest galement le cas, par exemple, de lchange montaire stricto sensu dans la conclusion dune transaction commerciale dont le contenu smiotique se rsume aux effets potentiels lis au transfert de biens dans le cadre dun systme conventionnel trs prcis. Les transactions se transforment en transactions informationnelles quand les situations transactionnelles se standardisent ce qui saccompagne dune routinisation des comportements et dune codification de la production smiotique. Dans la littrature en informatique, il est souvent dusage de dsigner les productions que nous considrons comme informationnelles en considrant quelles contiennent des donnes structures gres par les bases de donnes de gestion automatises classiques 155 , opposes aux donnes semi-structures vhicules par les Technologies de lInformation et de la Communication, et renvoyant aux documents numriss beaucoup moins codifis. Bien sr, les documents numriss contiennent galement des donnes structures et il faut comprendre cette expression en considrant quelle sous-entend que dans les systmes de gestion automatiss classiques, les donnes structures tendent puiser la signification du pseudo-document formulaire alors que la codification ne concerne que des zones restreintes ddies au rfrencement et aux liaisons explicites entre fragments dans le document semi-structur. Mais en rentrant dans les dtails, les choses sont toujours plus complexes, les systmes de codification utiliss dans les pseudo-documents formulaires ntant pas toujours aussi univoques que leurs concepteurs lesprent gnralement pour les utilisateurs auxquels les informations sont destines.
154.

Tous les formulaires ne sont pas des pseudo-documents notamment quand ceux-ci incluent des champs de type texte libre et donnent lieu des interventions scripturales varies des contributeurs. Les pseudo-documents formulaires correspondent aux formulaires dont la valeur possible des champs est ferme. Quand ils sont entirement automatiss leur existence peut napparatre quau moment de la saisie et de certaines requtes. 155. Type bases de donnes relationnelles.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 161/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Par contraste, la caractristique des donnes semi-structures vhicules par les NTIC, qui correspondent des documents numriss au sens de notre dfinition, est gnralement que leur interprtation ne peut pas se faire sans considrer les caractristiques toujours pour partie variables de la situation transactionnelle qui nest pas, dans le cas de lusage des NTIC, compltement standardise. De ce fait, la connaissance du nom du ralisateur de la production smiotique, son auteur, est par exemple ncessaire la bonne interprtation du contenu smiotique. Ces informations devront donc tre fournies dans le document pour faciliter son exploitation externe comme interne alors quelles ne le sont pas toujours dans un formulaire de saisie. Dans ce cas, la connaissance de la fonction de lauteur du formulaire peut souvent se substituer, jusqu un certain point, la connaissance prcise de son identit. Le rfrencement des productions informationnelles lintrieur des bases de donnes est peu problmatique dans la mesure o du fait de la standardisation extrme de la situation transactionnelle, qui permet la formalisation de lexpression, il existe une isomorphie assez stricte entre la structure de linformation et certains paramtres de la situation transactionnelle qui serviront la recherche du pseudo-document. Dans le cas dune facture simple, par exemple, lintitul, le montant, le destinataire, correspondent en principe exactement aux paramtres de la situation et aux effets de la transaction sur celle-ci. Lors de la recherche de la facture, lensemble des paramtres pertinents de la situation transactionnelle, correspondant aux champs du formulaire sont prdfinis et lensemble des contenus informationnels changeables , les valeurs possibles, restent dans des plages de variation elles aussi prdfinies. Par contre, les conditions dacquisition et dexploitation de ces donnes pouvant tre assez diverses et ncessiter notamment des comparaisons avec dautres informations, la problmatique de la dfinition dune interface homme machine adapte peut tre, elle, plus complexe traiter. Dans le cas des documents plus riches, le couplage entre les paramtres de la situation transactionnelle et la nature du contenu smiotique est beaucoup moins troit. De ce fait, la problmatique du rfrencement du document par rapport des usages assez ouverts est un problme en soi. La notion de genre , par exemple, utilise en sciences de linformation (Aussenac & Condamines 2004), fait partie des efforts pour dfinir des classifications a priori des usages des documents pouvant tre utilises pour leur rfrencement. Elle se base sur une valuation globale de lintrt du document pour une classe de lecteurs et sur une approche strotype des situations transactionnelles associes.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 162/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Transactions documentaires

cause de lindtermination relative de certaines transactions communicationnelles qui peuvent viser des rcepteurs nombreux aux intrts variables, dautres transactions spcifiques seront ncessaires la recherche et au classement de ce document dans un systme de rangement, correspondant des usages documentaires spcifiques que nous diffrencions des usages primaires associs la production smiotique dorigine. Ainsi, on ne confondra pas lexploitation dun document mdical dans une situation de soin (usage ou transaction primaire), de la recherche de ce document lintrieur dune bibliothque (usage ou transaction documentaire). Les transactions documentaires peuvent galement impliquer des acteurs diffrents de ceux associs aux transactions primaires. Aux transactions smiotiques de nature documentaire seront donc associes des productions smiotiques ou informationnelles spcifiques finalises par la recherche et le classement du document. Dans le contexte de la documentarisation et en particulier de la professionnalisation associe cette activit, ces productions smiotiques seront elles-mmes pour partie standardises et inscrites sur une partie spcifique du support du document. Il sagit notamment des ressources terminologiques et ontologiques, (RTO, pour reprendre lexpression dAussenac et Condamines 2004), galement dnommes mta-donnes , qui relvent de la catgorie plus gnrale des bases de codification incluant galement diffrents systmes de numrotation. Dans certains cas, les transactions documentaires peuvent donc sappuyer sur des transactions informationnelles. Les bases de codification incluant les ressources terminologiques et ontologiques et les systmes de numrotation ncessitent, pour larticulation documentaire externe, une standardisation des paramtres de la situation transactionnelle jugs pertinents comme le nom des ralisateurs, la date, le lieu de production etc., auxquels sajoutent des donnes relatives aux caractristiques du support et sa localisation physique (nombre de pages, exemplaire, emplacement, etc.). Pour larticulation smantique interne, elles utiliseront notamment des ressources ontologiques de nature soit formelle soit smiotique (cf. infra), permettant la navigation dans le contenu smiotique.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 163/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Transactions communicationnelles mergentes dans les documents fragments : DopA et annotations

Documents lisses, documents fragments

Comme nous lavons voqu plus haut, un document, sous lapparence dun projet transactionnel unique dcrit par son titre, natteint cet objectif que par le biais du recours un nombre ventuellement trs important darguments qui sont autant de microtransactions communicationnelles participant de latteinte des objectifs du projet principal. Dans un document technique, la longueur est souvent justifie par la fourniture dun argumentaire dtaill visant rpondre aux objections virtuelles qui pourraient tre souleves par les bnficiaires auxquels ils sadressent. Dans le domaine des transactions dominante expressives, qui poursuivent des projets de nature plus esthtique que normative ou intellectuelle (cf. Zacklad 2005a), les transactions sinscrivent dans une logique de rcit descriptive et les configurations darguments sont alors plutt lies mise en place de diffrentes scnes au sein desquelles se droulent les actions des personnages. Le succs des transactions littraires de fiction tient sans doute en grande part aux conditions didentification des lecteurs vis--vis des transactions dcrites, qui dpendent de leur vraisemblance et du plaisir associ la dcouverte de nouvelles dimensions de lexprience des personnages. Plus le document apparat comme lisse , comme sil tait crit dun seul tenant, plus les diffrentes prises en charges nonciatives correspondant des microtransactions communicationnelles sont implicites, les prsupposs autoriss par le partage dun terrain reprsentationnel commun permettant un enchanement naturel des arguments . Chaque technologie littraire correspondant un genre privilgie une modalit de liaison smantique implicite particulire. Inversement dautres documents apparaissent comme beaucoup plus fragments, les diffrentes microtransactions communicationnelles tant explicitement articules les unes aux autres par le biais dun systme de numrotation, dun sous-titrage, dun ensemble dattributs spcifiques visant expliciter le statut des fragments dans le document et leur relation avec les fragments environnants. Cette fragmentation pourra tre extrme dans une classe de documents

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 164/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

jouant un rle essentiel dans la coordination des transactions communicationnelles distribues, les documents pour laction .
Production smiotique cooprative : documents et dossiers pour laction

Dans un nombre croissant dactivits professionnelles coopratives, notamment dans les activits dominante intellectuelles , le produit intermdiaire ou final de la coopration est une production smiotique qui aura elle-mme vocation faire lobjet dautres transactions des chelles spatio-socio-temporelles plus grandes. Les collectifs engags dans des activits coopratives intenses et structurellement ouvertes (Zacklad 2003a, 2003b) tant eux-mmes de plus en plus distribus spatio-temporellement et les environnements de travail de plus en plus numriss et webiss, la stratgie de documentarisation soutenue par lintensification du recours aux quipements techno-informationnels apparat comme une des stratgies privilgie. Les quipements techno-informationnels utiliss correspondent, par exemple, aux diteurs de textes qui offrent des possibilits dannotation tout en tant particulirement bien intgrs aux outils de messagerie. Mais les activits communicationnelles associes la coopration structurellement ouverte soutenue par des supports prennes gnrent des documents trs diffrents des documents qui sont, par exemple, rangs dans des bibliothques stockant des uvres au sens traditionnel de ce terme. Ces documents, les documents pour laction (DopA), sont pourtant de plus en plus indispensables aux activits collectives coopratives et ils correspondent un nombre croissant dusages collectifs des TIC dans le contexte dactions collectives finalises. Dans certains cas, quand ils regroupent des productions correspondant des situations transactionnelles distinctes mais fortement interdpendantes, nous parlerons de dossier pour laction . Les exemples de DopA sont trs divers et correspondent de nombreux contextes professionnels. Citons, sans tre exhaustif, les documents de conception en ingnierie (mcanique, logiciel), les dossiers patients en mdecine, les documents contractuels dans un contexte daffaires, qui passent du stade de proposition commerciale au stade contrat en bonne et due forme, les dossiers qualits de plus en plus souvent numriss, les rapports dtude dans le conseil en management, les forums dchange dans le domaine, par exemple, du logiciel libre (Gasser et Ripoche 2003) 156
156.

On regardera avec intrt les tudes de Gasser (cf. par exemple Gasser et Ripoche 2003) sur lhtrognit des contributions documentaires dposes dans les forums de dveloppement de logiciels libres eu gard la ralit quils dcrivent : le logiciel, son fonctionnement, ses bugs Celle-ci nempche pas une certaine efficacit dans la coordination des actions collectives.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 165/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Leurs caractristiques principales sont les suivantes :


Inachvement prolong : ils possdent un statut dinachvement prolong pendant la phase active de la production smiotique collective, phase durant laquelle nous les appellerons des DopA en volution (vs DopA stabiliss) ; Prennit : ils possdent une certaine prennit associe aux engagements des acteurs lgard des contenus smiotiques vhiculs et la distribution des transactions, do des enjeux lis leur documentarisation et corollairement leur stockage et leur indexation ; Fragmentation : au moins pendant leur phase volutive, ils articulent plusieurs fragments plus ou moins lis smantiquement (notamment des annotations) qui ne peuvent tre intgrs mcaniquement ou de manire organique lensemble du document (cf. infra) ; Rapport non trivial aux ralisateurs : les diffrentes parties du DopA sont le plus souvent produites par diffrents ralisateurs (plurivocit, pluri textualit) qui peuvent avoir des statuts variables dans la situation transactionnelle et donc vis-vis de la production smiotique (droits, engagement, responsabilits) ; Rapport argumentatif non trivial aux autres parties du document : chaque partie possde une relation potentiellement complexe aux autres modalisation, incertitude, relation argumentative vis--vis des autres fragments

Ces caractristiques des DopA font quils sont mme de justifier de nouveaux principes dindexation et de classement encore peu pris en compte dans la profession documentaire, mais qui rpondraient aux besoins de microbibliothques numriques ddies des collectifs restreints. Celles-ci permettraient dassister les activits oprationnelles de gestion de linformation mais galement, grce larchivage des diffrentes versions des DopA, de contribuer la gestion des connaissances de ces collectifs selon des temporalits plus importantes. La finalit dune indexation nest pas la mme selon quelle sinscrit dans un processus volutif et sert lactivit cooprative dun collectif restreint, ou quelle vise des documents stabiliss mis disposition dune vaste communaut dutilisateurs potentiels. En particulier, dans le cas des DopA volutifs, le document passe par un nombre important de versions au travers desquelles son statut va changer de mme que celui des fragments qui le compose. Par ailleurs, ils relvent de technologies littraires et documentaires trs diverses correspondant des degrs variables de standardisation de la situation transactionnelle qui induit elle-mme une standardisation des rles jous par les participants et du format de leurs productions

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 166/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

smiotiques. Dans un ordre de structuration dcroissant et sans tre exhaustif, on pourra ainsi contraster (1) lusage de formulaires ouverts, (2) le recours des plans types (par exemple, des modles systmiques en ingnierie, ou le plan conventionnel dun contrat juridique), (3) des conventions dcriture correspondant un style strotyp de type descriptif ou argumentatif, par exemple, dans le contexte de la littrature scientifique, (4) les systmes de question/rponse utiliss dans les forums et enfin (5) les documents narratifs, dans lesquels les efforts de style visent au contraire, masquer le plan sous-jacent. Dans chacune de ces technologies littraires 157 et documentaires, les rles respectifs des liaisons mcaniques et organiques varient de mme que le degr global dintgration du document (un forum, par exemple, propose une articulation organique et nous semble moins intgr quun document technique).
Transactions communicationnelles mergentes dans les activits coopratives

Pour bien comprendre la structuration des DopA, il est ncessaire danalyser la dynamique transactionnelle quils autorisent. Or, si cette modalit de distribution des transactions est sans quivalent rel dans les technologies de la coopration prcdant la numrisation intensive des supports, elle peut sapparenter, au moins mtaphoriquement, aux transactions communicationnelles qui prvalent dans les activits coopratives synchrones. Dans ces situations, qui correspondent par exemple aux runions de travail, les diffrents participants peuvent proposer des lments de solution, se contredire, argumenter, dans le cadre dinteractions polylogales soutenues ou non par lutilisation dun support dinscription collectif, tel quun tableau. Dans les interactions polylogales, les transactions communicationnelles relvent de processus de type mergent. En effet, dans ces contextes, la situation transactionnelle est en mesure dtre reconfigure rapidement, notamment en ce qui concerne la slection des participants la transaction, en ratifiant explicitement ou non des participants, quils soient prsents ou absents, concrets ou idaliss (une personne collective, par exemple). De mme, la capacit des acteurs sexprimer en nous peut tre analyse comme la capacit proposer rapidement la constitution dun acteur collectif dfini par un self commun aux contours plus ou moins prcisment dfinis. De la mme manire, le recours des formulations implicites ou lusage dindexicaux pour faire rfrence diffrentes composantes de lenvironnement rend le contenu smiotique potentiellement ambigu hors de la situation dnonciation. De ce fait, une transaction smiotique initie par un ralisateur dans une situation dinteraction polylogale est sujette de multiples interprtations qui
157.

La notion de technologie littraire est ici utilise dans un sens trs large puisquun formulaire est considr comme relevant dun style particulier

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 167/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

correspondent diffrentes offres de microtransactions virtuelles qui ne pourront tre considres comme engages quen fonction des ractions des autres participants. Dans les interactions polylogales en prsentiel, les participants cherchent en permanence confrer une cohrence aux transactions en sappuyant sur leurs connaissances des composantes de la situation transactionnelle et sur leurs comptences communicationnelles (du type rgle de pertinence de Grice, 1979) pour dsambiguser les transactions. Celles-ci sont dautant plus flexibles et potentiellement efficaces que les participants se situent dans un cadre spatio-sociotemporellement homogne qui leur permet de corriger en continu les erreurs dinterprtation supposes. Dans le contexte de transactions distribues par le biais de DopA, il sera ncessaire de fournir des mcanismes supportant des formes de transactions mergentes en partie analogues, suscites par le dispositif technique, mais ne pouvant bnficier pour leur ralisation des ressources offertes par linteractivit en situation prsentielle. Les dispositifs dannotation sont un des principaux mcanismes utiliss.
Importance des annotations dans les DopA

La principale difficult laquelle sont confronts les acteurs qui coproduisent un DopA est le manque dinformation sur les paramtres du contexte transactionnel associ la proposition dun fragment, correspondant lui-mme une offre de transaction. Lorsquils interviennent sur le DopA, ils le font en dposant sur le support des fragments libres associs aux diffrents moments dune microtransaction communicationnelle dpose sur un support prenne. Le fragment est complet sil correspond une microtransaction cohrente pour les participants (p.e. un nonc non interrompu), incomplet dans le cas contraire. Le rapport du fragment la production smiotique principale en cours dlaboration dans le cadre de la transaction peut tre variable. Dans les transactions communicationnelles en face face, par exemple, certaines microtransactions seront considres comme des digressions, des tentatives non abouties de la part de certains participants pour tenter dorienter la coproduction smiotique collective dans des directions correspondant leurs souhaits. Dans le contexte des transactions communicationnelles distribues et recourant des supports prennes, les contributions sont mdiatises par des fragments qui seront lis avec plus ou moins de succs la production smiotique principale (p. e le texte principal). Quand le statut des fragments libres nest pas tabli ils constituent une production smiotique accessoire. Ces fragments seront progressivement exclus ou inclus du corps du DopA lors du processus de documentarisation impliquant une reprise et une articulation portant la fois sur lexpression et le contenu smiotique. Mais si les fragments libres ne sont pas renseigns, c'est--dire articuls, au fur et mesure quils

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 168/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

sont dposs sur le support, ce travail de reprise est impossible et le DopA ne peut alors soutenir efficacement les transactions mergentes distribues associes lactivit cooprative. Le procd majeur permettant larticulation dun fragment libre avec les autres parties du document est la production dannotations qui permet dexpliciter la liaison dun fragment avec la production smiotique principale, au moment de linscription ou de lenregistrement de celui-ci sur le support, ou aprs coup. De mme que toute transcription ou enregistrement sur un support prenne dune production smiotique ne suffit pas constituer un document, le fragment libre ne constitue une annotation qu lissue dun processus de documentarisation. Ainsi, nous dfinirons lannotation au sens fort comme un fragment de production smiotique documentaris, c'est--dire dot dattributs spcifiques permettant sa liaison explicite avec les autres composantes du document 158 . Lactivit dannotation, qui ne se confond pas avec le dpt dun fragment libre sur un support prenne, requiert donc un effort spcifique qui permettra la rexploitation des fragments dans le cadre dune activit individuelle ou collective distribue en restituant les lments du contexte transactionnel associs leur production 159 . Larticulation caractristique de lannotation est son ancrage plus ou moins explicite sur une zone du support traduisant une relation elle-mme plus ou moins prcise avec un lment du contenu smiotique. Le fait dindiquer le ralisateur de lannotation fait galement partie du processus de documentarisation de mme que toutes les modalits darticulation explicites traditionnellement utilises (date, lieu). Enfin, notons que la manire dont un fragment est constitu en annotation peut tre assez variable (cf. Zacklad et alii 2003). Elle peut (1) constituer une proposition ayant vocation sintgrer dans la production smiotique principale en remplacement dun autre fragment ou en la prolongeant, (2) viser stimuler dautres productions smiotiques, formuler des critiques ou poser des questions sans avoir de vocation rester dans la production smiotique principale et enfin (3) avoir vocation constituer demble une annotation permanente, commentaire valide et prenne sur la production smiotique principale, inscrit sur une zone ddie du support.

158.

Cette dfinition nest pas en opposition avec la dfinition rcente donne de lannotation par Bringay, Carry et Charlet (2004), qui analysent celle-ci comme la trace des reprsentations mentales voques au sujet de la cible. Nous sommes surtout plus exigeant dans notre dfinition : lannotation au sens fort implique une forme de documentarisation pour soutenir les activits distribues articules sur le document. 159. Un fragment vocation annotative qui ne serait pas rexploitable par ses bnficiaires potentiels lissue de sa cration par dfaut de documentarisation ancrage peu clair, auteur incertain, signification ambigu pourrait au mieux tre considre comme une annotation au sens faible.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 169/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Ces statuts variables de lannotation, qui peuvent eux-mmes varier en fonction de lvolution du cycle de vie du document, dpendent pour une large part du statut des ralisateurs. Par exemple, quand une contribution mane dun auteur ayant totale autorit, il est possible dintgrer directement la production smiotique principale un fragment en larticulant avec celleci de manire implicite (p. e prolongation naturelle du texte) ou explicite (p. e numrotation ou renvoi). Dans le premier cas, celui dune liaison mcanique par un auteur lgitime tablissant demble sa contribution comme appartenant la production smiotique principale, le fragment ne passe pas par le statut dannotation. Dans le cas contraire, celui dune lgitimit insuffisante, la contribution pourra tre annotative le temps que le collectif se prononce sur son intgration dans la production smiotique principale. Ceci implique de recourir un attribut explicitant le statut exogne et potentiellement temporaire de la contribution, comme cest le cas dans lutilisation dun code couleur associ aux annotations en mode rvision dans les diteurs de texte.
Codification de linvestissement documentaire dans les technologies de coopration

Ldition et lexploitation semi-automatique ultrieure des annotations au sein dun document numrique impliquent une codification de ses attributs, que ceux-ci concernent larticulation externe du fragment au DopA ou son articulation interne des lments du contenu smiotique en substituant certaines liaisons tacites une justification explicite. Comme on la vu dans lexemple de la facture, la codification permet dassocier de manire univoque des paramtres de la situation transactionnelle reprsents par des champs (acteurs, caractristiques spatiales et temporelles travers mention de la date et du lieu, caractristiques des objets changs, etc.) un contenu smiotique descriptif standardis inscrit sur une zone du support, la valeur des champs (un nom propre, une date, des attributs codifis reprsentant la valeur des objets de manire plus ou moins explicite). La codification sappuie sur un ensemble de ressources prdfinies (une base de codification) sappuyant sur des donnes administratives officielles (noms propres), un travail de modlisation ad hoc gnrant des listes, thsaurus, ontologies, ou rsulte dun processus de gnration automatique correspondant une fonction au sens mathmatique (comme pour la date ou lattribution dun numro dordre). Llaboration de la base de ressources de codification, ou base de ressources dindexation (utilisant ou non un systme de classification), de mme que le travail de codification des transactions elles-mmes (classification des instances), correspond un investissement documentaire spcifique ncessitant un effort plus ou moins important. La qualit de la base de ressources facilitera ou compliquera la classification par rapport lutilisation dune description ad

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 170/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

hoc. Le retour de cet investissement est fourni lors de lexploitation ultrieure du document, quil sagisse de le retrouver ou de sorienter lintrieur du contenu smiotique quil vhicule, par la rduction du cot cognitif associ cette exploitation. Dans un certain nombre de cas, les technologies de la coopration pourront tirer partie de la codification pour faciliter le travail coopratif du collectif, en facilitant les oprations de recherche et de filtrage des fragments documentaires, par exemple. Parfois, elles permettront galement dautomatiser partiellement une partie du travail de classification des instances (codification des fragments), rduisant de manire apprciable linvestissement documentaire des utilisateurs. Cest le cas des systmes dannotation offerts dans les logiciels ddition de texte qui offrent automatiquement une codification partielle de lannotation selon un certain nombre dattributs standards, auteur, date, ancrage, numrotation Mais cest galement le cas dautres technologies de coopration qui ne sont pas ncessairement apprhendes comme des technologies documentaires annotatives mais qui pourtant en possdent plusieurs caractristiques. Cest le cas de deux technologies dont les usages font lobjet dtudes approfondies : le courrier lectronique, bas sur une mtaphore pistolaire, et les forums de discussion, bass sur la mtaphore de la participation une discussion collective. Dans le cas des forums, qui constituent une classe de DopA particulirement importante, la prennit du support et sa mise disposition sur un serveur partag permettent tous les contributeurs de rajouter des fragments de texte un niveau quelconque de la discussion en cours, sans pouvoir toutefois choisir lintrieur du texte une zone dancrage prcise. Larticulation smantique des fragments contributifs sur un mode annotatif se fait par la codification de la date et de lauteur, par la reprise du titre de la contribution initiale dans la rponse, par la localisation dans la hirarchie des fils de discussions, voire, dans certains dispositifs, par la slection dun type strotyp dintervention (question, commentaire). Cependant, bien que les forums soient prsents comme des systmes de dialogue distance, des observations dtailles montrent quils ne correspondent que faiblement aux modles conversationnels traditionnels des polylogues en prsentiel (Lewkowicz & Marcoccia, 2004). Comme souvent dans le cas des innovations importantes, les forums de discussion navaient aucun quivalent rel avant le dveloppement des technologies documentaires numriques. Par ailleurs, la codification des transactions offerte par les forums est assez souvent insuffisante pour permettre une rexploitation aise des contenus smiotiques dposs et ce dans le contexte dune forte htrognit du cadre spatio-socio-temporel qui implique, notamment, une comprhension

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 171/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

des transactions en cours par des acteurs ntant pas les auteurs initiaux des contributions effectues. En conclusion, nous prsenterons des pistes de recherche relevant dun programme de socio-informatique (associant CSCW et ingnierie des connaissances) qui permettrait damliorer les technologies actuelles de la coopration, en sappuyant sur une comprhension plus fine des mcanismes transactionnels en jeu.

Conclusion : nouveaux dispositifs pour la gestion des bases de codification, web socio smantique et ontologies smiotiques Dans les recherches en CSCW et en Ingnierie des Connaissances, la comprhension des processus cognitifs et sociaux est mise profit pour proposer de nouvelles caractristiques fonctionnelles pour les technologies de la coopration ce qui, en retour, grce au double processus (I) de description systmatique et dtaille associ la spcification des nouveaux scnarios et (II) dvaluation des usages des maquettes ralises, permet de gnrer de nouvelles hypothses de recherche visant mieux comprendre le fonctionnement des transactions communicationnelles et leurs conditions de ralisation. Dans les recherches de Lewkowicz et Marcoccia (2004), par exemple, on propose notamment un nouvel attribut pour larticulation smantique externe dun fragment selon que le bnficiaire de la microtransaction propose est un participant ratifi ou lensemble du collectif intervenant sur le forum. Lexploitation de ce nouvel attribut a des consquences sur linterface homme machine pour lintervention dans le forum comme pour la visualisation des microtransactions antrieures. Dans les projets Mdiapro et Mdianotte (Zacklad et alii 2003), lobjectif est de proposer de nouveaux attributs pour des annotations dans les DopA qui tiennent compte de diffrentes dimensions ; la micro-organisation (auteur, statut, date, projet en cours), les connaissances du domaine (les domaines professionnels dont relve lannotation correspondant une indexation thmatique), largumentation (formulation de contrainte, suggestion, critique, valuation). La dfinition au sein dun collectif engag dans un projet commun dune base de codification commune fait lobjet dun programme du laboratoire Tech-CICO correspondant au dveloppement dun Web-Socio-Smantique (W2S). Complmentaire au projet du Web Smantique, qui met principalement laccent sur la dfinition dontologies formelles (universelles et totalement standardises), le projet du W2S vise fournir des bases de codification mallables et adaptes aux besoins volutifs des communauts locales dutilisateurs. Au lieu

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 172/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

dontologies formelles, le W2S propose de recourir des ontologies smiotiques (Zacklad 2005b) qui mettent en relation interprtative la fois les concepts smiotiques et les situations quils dnotent et les connotations mutuelles des concepts smiotiques entre eux dans une logique multi points de vue 160 . Lexploitation des DopA, intrinsquement inachevs et confrontant les points de vue de communauts dutilisateurs diverses, requiert selon nous lusage de ces nouvelles techniques de codification, moins calculables mais beaucoup plus proches des besoins et des usages des communauts utilisatrices.

Bibliographie
AUSSENAC, N., CONDAMINES, A., Documents lectroniques et constitution de ressources terminologiques ou ontologiques , Information-Interaction-Intelligence, vol. 4, n 1, p. 75-94, 2004. BACHIMONT, B., Arts et sciences du numrique : ingnierie des connaissances et critique de la raison computationnelle, Habilitation diriger des recherches de lUniversit Technologique de Compigne, 2004. BERNEERS LEE, T., HENDLER, J., LASSILA, O., The Semantic Web , Scientific American, May <http://www.sciam.com/article.cfm?articleID=00048144-10D2-1C70-84A9809EC588EF21> 2001, [fvrier 2007] BRIET, S., Qu'est-ce que la documentation ?, Paris, EDIT, 1951. BRINGAY, S., BARRY, C., CHARLET, J., The Heath Record: Kernel of a Medical Memory , Knowledge Management and Organisational Memory Workshop (associated to ECAI04), 2004. BROWN, J.-S., DUGUID, P., The Social Life of Documents , in Dyson, E. (d.), The Social Life of Documents, p. 1-18, New York, Edventure Holdings Inc, 1995. BUCKLAND, M.-K., What is a document? , Journal of the American Society for Information Science, 48 (9), 1997, p. 804-809. BUCKLAND, M.-K., What is a document? , Document Numrique, Paris, 1998, p. 221-230. <http://www.sims.berkeley.edu/%7Ebuckland/digdoc.html> [fvrier 2007]

160.

La gestion de ces ontologies smiotiques se fait laide du standard HyperTopic lui mme implment dans la plateforme Agorae (p.e. Cahier, J.-P., et alii, 2004). Celle-ci vise permettre la gestion volutive par diverses communauts dutilisateurs des ontologies smiotiques.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 173/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

CAHIER, J.-P., ZACKLAD, M., Towards a Knowledge-Based Marketplace model (KBM) for cooperation between agents , in Blay-Fornarino, M. Pinna-Dery, A., Schmidt, K., Zarat, P., Cooperative System Design : 226-238, IOS Press, 2002. CAHIER, J.-P., ZACKLAD, M., MONCEAUX, A., Une application du Web socio-smantique la dfinition dun annuaire mtier en ingnierie , Actes des journes Ingnierie des Connaissances 2004, mai 2004, Lyon. CLARK, H.-H., Using language, Cambrige University Press, 1996. DOURISH, P. and BELLOTTI, V., Awareness and coordination in shared workspaces , in Proceedings of the CSCW'92 Computer-Supported Cooperative Work, Toronto, Canada, 1992. GASSER, L., RIPOCHE, G., Distributed Collective Practices and F/OSS Problem Management: Perspective and Methods , Conference Cooperation, Innovation & Technologie, (CITE2003), dcembre 2003, Troyes. GRICE, P., Logique et conversation , Communications, 1979, p. 57-72. HEATH, C. and LUFF, P., Collaboration and control: Crisis management and multimedia technology in London Underground line control rooms , CSCW Journal, 1992, p. 69-94. KERBRAT-ORECCHIONI, C., La Conversation, Paris, Seuil, 1996. KERBRAT-ORECCHIONI, C., Les Actes de langage dans le discours, Paris, Nathan Universit, 2001. LEWKOWICZ, M. and MARCCOCIA, M., The participative framework as a design model for newsgroups: PartRoOM , in Darses, F., Dieng, R., Simone, C., Zacklad, M., Cooperative Systems Design, 2004, IOS Press, p. 243-257. LEWIS, D. K., Convention: a philosophical study, Cambridge MA, Harvard University, 1969. OTLET, P., Trait de documentation, Brussels, Editiones Mundaneum, 1934, Reprinted : Lige : Centre de Lecture Publique de la Communaut Franaise, 1989. PDAUQUE, R.-T., Document : forme, signe et mdium, les re-formulations du numrique , Working paper, <http://archivesic.ccsd.cnrs.fr/sic_00000511.html>. SCHMIDT, K., SIMONE, C., Coordination mechanisms: Towards a conceptual foundation of CSCW systems design , CSCW Journal, mai 1996, p. 155-200. TAYLOR, J.-R., COOREN, F., GIROUX, N., ROBICHAUD, D., The Communicational Basis of Organization: Between the Conversation and the Text , Communication Theory, 1996, p. 1-39.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 174/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

ZACKLAD, M., La thorie des Transactions Intellectuelles : une approche gestionnaire et cognitive pour le traitement du COS , Intellectica, 30 janvier 2000, p. 195-222. ZACKLAD, M., Un cadre thorique pour guider la conception des collecticiels dans les situations de coopration structurellement ouvertes , in Bonardi, C., Georget, P., Roland-Levy, C., Roussiau, N., Psychologie Sociale Applique, conomie, Mdias et Nouvelles Technologies, Paris, In Press, coll. Psycho, 2003 a, p. 135-164. ZACKLAD, M., Communities of Action : a Cognitive and Social Approach to the Design of CSCW Systems , Proceedings of GROUP2003, Sanibel Island, Florida, USA, 2003 b, p. 190-197. ZACKLAD, M., Annotation collective en conception : thorisation de la notion de Document pour lAction et de sa lecture/criture hypertextuelle collective au travers du processus annotatif, journe Connaissances et Documents du GDR I3, octobre 2003, (2003c), Paris, <http://www.irit.fr/> [fvrier 2007]. ZACKLAD, M., LEWKOWICZ, M., BOUJUT, J.-F., DARSES, F., DTIENNE, F., Formes et gestion des annotations numriques collectives en ingnierie collaborative , in R. Dieng-Kuntz, Actes des 14es journes francophones dIngnierie des Connaissances, Presses Universitaires de Grenoble, 2003, p. 207-224. ZACKLAD, M., Transfrabilit des connaissances : une reconceptualisation de la distinction tacite/explicite , En route vers Lisbonne : 1er colloque luxembourgeois sur l'conomie de la connaissance dans une perspective europenne, Luxembourg, 12 au 13 octobre 2004, 12 p. ZACKLAD, M., Transactions communicationnelles symboliques et communaut daction : une approche de la cration de valeur dans les processus coopratifs , in P. Lorino et R. Teulier, Connaissance, Activit, Organisation, 2005a, Maspro. ZACKLAD, M., Vers le Web Socio Smantique , in Actes de la confrence Ingnierie des Connaissances 2005, Nice, mai-juin 2005, (2005b). ZACKLAD, M., Dimension conomique des interactions verbales : quand illocutoire et perlocutoire se rejoignent , Actes des journes Stratgies cognitives et discursives dans les interactions verbales, Paris, 8 et 9 octobre 2004, (2005c).

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 175/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Partie 5 - Complexits de la gestion des documents numriques

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 176/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

La conservation des bases de donnes


Marc LEBEL M.b.a. Charg de cours, Chef de la Section de la gestion de documents Ville de Montral
Rsum : La prennit des informations numriques proccupe les archivistes. Elle pose des dfis au niveau du stockage et la restitution des documents lectroniques afin den assurer la conservation et lintgrit. Plusieurs groupes de recherches sintressent de faon pertinente ces questions. Il me semble que la problmatique de la conservation permanente des bases de donnes nobtient pas toute lattention quelle mrite compte tenu de limportance des bases de donnes dans les administrations. Cette communication expose la comprhension et les proccupations dun praticien face la problmatique de la conservation des bases de donnes. Il aborde limportance des bases de donnes dans les organisations, les pratiques actuelles et quelques considrations pour la conservation permanente des bases de donnes. Finalement, il envisage, comme une possible solution, lutilisation des entrepts de donnes. Bien modestement, cette communication peut dgager des pistes de recherches afin de proposer des solutions cette problmatique.

Dfinition Pour ce texte, une dfinition restrictive dune base de donnes est retenue.
a database as a structured collection of data items stored, controlled, and accessed through a computer based on predefined relationships between predefined types of data item related to a specific business, situation, or problem. (Alter, p. 512) paper memos in a file cabinet are not a database because they are not accessed through a computer. Similarly, the entire World Wide Web is not a database of this type because it lacks predefined relationships between predefined types of data item (Alter, p. 116).
Limportance des bases de donnes

Les bases de donnes sont au cur des oprations des organisations. Elles supportent des activits comme la gestion des commandes, les relations avec les clients, la planification de la production, la gestion du personnel. titre dexemple, les grandes socits de services publics grent tous leurs dossiers clients grce des bases de donnes ; les documents sur support papier

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 177/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

deviennent accessoires. Toutes les informations oprationnelles vitales pour les organisations sont consignes dans les bases de donnes. Les bases de donnes sont essentielles lautomatisation des processus daffaires, du commerce lectronique, etc. Utilises de faon intensive depuis le dbut des annes soixante, la problmatique de leur conservation se pose avec acuit. Bien quomniprsentes, les bases de donnes seront davantage utilises aux cours des prochaines annes. Entre autres, les investissements massifs 161 pour limplantation de systmes intgrs de gestion (SIG ou ERP en anglais) et pour les systmes de gestion des relations avec les clients, dmontrent limportance toujours croissante des bases de donnes.

Les pratiques actuelles Peu dorganisations disposent de programmes structurs pour lpuration de leurs bases de donnes et pour leur conservation long terme. Cette situation peut sexpliquer, en partie par les cots associs lpuration et la conservation des bases de donnes. En labsence dpuration des bases de donnes, des dlais supplmentaires sont ncessaires pour :
reprer un champ dans la base de donnes ; complter une transaction ; effectuer une copie de sauvegarde ; accomplir une opration de maintenance.

Dans certains cas, les lgislations obligent lpuration des renseignements personnels des bases de donnes lorsque l'objet pour lequel un renseignement nominatif a t recueilli est accompli, l'organisme public doit le dtruire (Loi sur les archives). Il existe plusieurs termes pour dsigner lpuration dune base de donnes et la conservation dune base de donnes. Quatre pratiques sont courantes mais ne constituent pas un archivage en sens archivistique du terme. La copie de sauvegarde (backup) est une duplication de la base, afin de la rcuprer en cas de dsastre ou daltration de la base de donnes. Elle ne respecte aucun critre visant le recouvrement des donnes long terme. Lpuration des donnes reprsente la destruction des donnes sans lintention de les rcuprer. Lentrept de donnes (data wharehouse) est le transfert dune partie des informations vers un systme distinct (lentrept). Nous discuterons plus
161.

Mentionnons la Socit des Alcools du Qubec et son projet VSOP de 95 millions de dollars, la Ville de Montral et ses investissements de 50 millions, Hydro-Qubec pour 42 millions. Au cours des dernires annes, des firmes prives, telles Alcan, Pratt & Whitney, Bombarder, ont procd limplantation de tels systmes.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 178/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

loin de cette opration qui peut tre utile pour la conservation permanente des donnes. Finalement, les donnes sont transfres dans un systme statique. Cette dernire solution mrite une attention particulire puisquelle est largement rpandue. Le transfert des donnes vers un systme statique prend plusieurs formes : limpression des donnes sur papier, la production de microfiche (fiche SOM) ou le transfert des donnes dans des fichiers plats. Dans le cas des bases de donnes complexes, seulement une partie des donnes sera reproduite puisquil est difficile de reproduire toutes les donnes dans une seule liste. Plus dplorable, ces systmes statiques ne reprsentent pas les relations entre les diffrentes donnes, ce qui empche une bonne comprhension du contexte dutilisation des donnes. Les systmes statiques rduisent considrablement le potentiel de recherche. Dans le cas des impressions sur papier et des microfiches, certaines recherches deviennent pratiquement impossibles. titre dexemple, pensons une recherche dans les donnes dun recensement comprenant des millions dlments. Le chercheur devra lire chaque enregistrement. Thoriquement, il existe des mthodes pour recharger ces informations dans une base de donnes. En pratique, les cots dune telle opration sont prohibitifs donc inabordables pour la majorit des projets de recherche. Malgr ces limites, le transfert des donnes vers des systmes statiques est une pratique courante. Faute de moyens et dalternatives viables, il sagit de la principale stratgie darchivage des donnes la Ville de Montral.
La valeur historique des bases de donnes

La valeur archivistique des bases de donnes ne fait pas de doutes. Des informations qui, auparavant, taient sur support papier et conserves en permanence, ne sont maintenant cres et consignes que dans des bases de donnes. Par exemple la Ville de Montral, le nombre de documents papier conservs dans les dossiers demploys a diminu de 80 % depuis 1980. Cette rduction sexplique essentiellement par lutilisation des bases de donnes pour grer le personnel. Un chantillonnage des dossiers demploys tait conserv en permanence. Dornavant, il faudra donc conserver le dossier physique et les bases de donnes ddies la gestion de personnel. Linformation, peu importe son support, conserve sa valeur de tmoignage. La structure des bases doit tre prserve des fins de reconstitution des pratiques de travail et comme tmoignage de lutilisation des technologies de linformation dans les organisations. Les composantes comme les tables, les champs, index, les relations entre les tables et les rapports produits, doivent donc tre conserves. Toute la documentation ncessaire la comprhension de la

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 179/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

base de donnes doit tre galement prserve ; cette dernire est souvent sous forme lectronique et intgre au logiciel servant au dveloppement de la base de donnes.

Lvaluation des bases de donnes Comme pour tout document, larchiviste devra faire lvaluation des bases de donnes. Toutes les bases de donnes ne mritent pas une conservation permanente. Lvaluation devra galement prciser le moment et la frquence de versement des fins de conservation permanente. Contrairement aux documents sur support papier, il est impossible didentifier une version dfinitive dun document puisque le contenu des bases de donnes est constamment modifi.
La description des bases de donnes

Au premier niveau, une base de donnes peut tre dcrite selon les rgles de description des documents darchives en vigueur. Cependant, la description dune base de donnes demande davantage de prcision puisque chaque lment (table, champ) dune base de donne doit tre dcrit. Sans description, le champ No de tlphone nest pas significatif. cette fin, la norme ISO/IEC 11179 Technologies de l'information Spcification et normalisation des lments de donnes doit tre retenue. Cette norme devra tre applique ds la conception des bases de donnes pour uniformiser leur description toutes les tapes de leur vie.
Le format et la technologie de conservation des bases de donnes

La question du format de conservation des bases de donnes demeure entire et complexe. Le dveloppement de solutions conomiques est essentiel pour que les organisations mettent en place des programmes de conservation. Les grandes institutions darchives ont dvelopp des modles et des applications informatiques pour la conservation des bases de donnes. Mentionnons, entre autres, Constance des Archives Nationales de France, AERIC de la U.S. National Archives and Records Administration, Ericson la Bibliothque et Archives Canada. Les solutions choisies par ces initiatives peuvent tre regroupes en quatre grandes catgories :
prservation de la technologie originale pour conserver les informations ; muler la technologie originale sur de nouvelle plate-forme ; migrer les logiciels et les donnes vers les formats plus rcents ; convertir les informations vers des formats plus standards.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 180/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

premire vue, et des recherches pourraient le vrifier, la conversion des informations vers des formats plus standards semble lalternative la plus conomique. Les cots seraient minimiss par :
lentretien dune seule plate-forme technologique ; la diffusion des bases de donnes archives (par internet ou autrement) partir dun seul format ; la conversion des donnes vers un seul format permettant le dveloppement dune expertise en la matire ; la migration pour suivre les changements technologiques dune seule plate-forme et dun seul format.

Un consensus dans le milieu archivistique propos du format standard permettrait de maximiser ces avantages.
Les normes de conservation

Les normes de conservation des donnes devraient sinspirer de celles des entrepts de donnes, qui regroupent lensemble des donnes dune organisation dans un seul systme. Leur laboration ne dcoule pas de besoins archivistiques mais des demandes des gestionnaires pour effectuer des recherches croises. Les entrepts de donnes sont galement utiliss pour une conservation intermdiaire aprs lpuration des bases actives. Dans un entrept, les donnes ont les caractristiques suivantes, qui rpondent aux proccupations des archivistes :
elles sont intgres ou normalises. Par exemple, la longueur du champ prnom aura toujours la mme forme ; elles sont dates et non-modifiables ; elles ne doivent pas tre volatiles afin de pouvoir rpter les recherches.

De plus, les donnes, les informations peuvent tre dtailles ou bien agrges. Ce choix dcoulera de lvaluation archivistique. Grce la centralisation des donnes, des recherches croises sont possibles. Par exemple, il sera possible de faire une corrlation entre laugmentation du budget ddi au marketing et les rsultats des ventes.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 181/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Lintervention de larchiviste

Si lentrept de donnes est retenu pour la conservation des bases de donnes, larchiviste doit intervenir ds leur cration au stade actif. Une intervention tardive entranerait des cots importants si des modifications sont demandes et des informations pourraient tre irrmdiablement dtruites. Idalement, lentrept de donnes utilis des fins administratives contiendrait toutes les informations conserver en permanence. Au besoin, une puration additionnelle serait effectue lors du versement dans lentrept dfinitif. Un parallle avec la thorie des trois ges peut tre tabli :
au stade actif, les donnes sont conserves dans les bases courantes ; au stade semi-actif, les donnes sont conserves dans les entrepts de donnes administratives ; pour la conservation permanente, les donnes sont conserves dans les entrepts de donnes dfinitives.

Conclusion Les entrepts de donnes semblent, premire vue, une solution prometteuse et conomique pour la conservation permanente des bases de donnes pour les moyennes et grandes organisations, puisquil sagit de rcuprer des applications dveloppes pour rpondre aux besoins administratifs. Cette solution est probablement trop onreuse pour des petites organisations o les entrepts de donnes sont inexistants. Des moyens plus adapts sont prvoir. Avant de gnraliser cette pratique, il faut cependant vrifier si elle permet de conserver toutes les donnes utiles sans altrer leurs caractristiques originales, ni perdre le contexte de leur cration. Les praticiens et les chercheurs devront rpondre ces questions puisque la ncessit de conserver des bases de donnes est incontournable.

Bibliographie
ALTER, S., Information systems, a management Perceptive, Addison-wesley, Reading Mass, 1999, 523 p. BOUSSAID, O., LALLICH, S., Entreposage et fouille des donnes, Toulouse, Cpadus, 2003, 282 p. Gouvernement du Qubec, Loi sur les archives, L.R.Q., c. A-2.1. MENSCHING, J., CORBITT, G., ERP data archiving a critical analyst , The Journal of Enterprise Information Management, Volume 17, Number 2, p. 131-141.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 182/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Cycle de vie du document lectronique et obligations de conservation


Najoua DJERAD Institut Suprieur de Documentation Universit La Manouba (Tunisie)
Rsum : Dployer tous les efforts requis pour que lcrit soit prserv dans ltat o il a vu le jour incombe tous les employs lors de lexercice de leurs fonctions. Plus dun texte juridique dicte des obligations de conservation, do limportance du respect de la rglementation du stockage des documents. Mais, il semblerait que lobservation de celle-ci nest plus si aise depuis limplication des technologies de linformation et de la communication dans llaboration de lcrit lectronique dment reconnu par le lgislateur. Tous ceux qui gnrent ou reoivent des crits lectroniques lors de laccomplissement de leurs tches professionnelles redoutent de ne pouvoir sacquitter de leurs obligations de conservation. Il est difficile dignorer la suspicion lgard des aptitudes du support lectronique maintenir ltat initial de lcrit. Le support lectronique ne remplit pas encore toutes les conditions requises en vue de la conservation de lcrit indpendamment de sa forme. Ses caractristiques rendent alatoire la non-altration du document et laccs son contenu peut savrer difficile aussi. Les consquences juridiques qui en dcoulent ne sont pas des moindres puisque lexcution des obligations de conservation peut tre rellement compromise. Un tel constat ne peut tre que conjoncturel. Des recherches pluridisciplinaires devraient tre faites afin quon parvienne dpasser les failles du support lectronique en matire de conservation des donnes. Abstract: It is the employeesduty, in their daily tasks, to maintain writing in the initial state of its creation. Regulation of stocked documents is prescribed in more than one legal text and therefore, is very important. The respect of such regulations is nevertheless more difficult, since the incorporation of Information Technologies, in digital writings must be recognized by the legislator. Those creating or receiving, digital works in their professional tasks, fear falling short of their storage obligations, not to mention the lack of faith in the abilities of the digital media to preserve the original state of the work. In fact, the digital media does not fulfill all the requirements, independently of its original version. Over time, accessing documents can be deemed a problem, as is the invariability of the works which depends on the documents and their formats. The legal consequences are real because the digital media itself does not assure people will be able to meet their preservation obligations. Such a statement can only be circumstantial.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 183/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Multidisciplinary researches are needed in order to surmount the flaws of digital Medias in data preservation.

Une rflexion sur le cycle de vie du document implique de sintresser toutes les tapes de sa vie. Rappelons que les fonctions de lcrit 162 varient en fonction de son ge. Une archive dfinitive joue un rle patrimonial. Quant celle rpute active, elle permet ses dtenteurs de sen prvaloir sur le court terme et justifie par consquent dune utilit immdiate. Le droit positif a, depuis plusieurs annes dj, et dans plus dun pays, consacr lindpendance du document de son support163 . Cest dans ce sens que le lgislateur tunisien a dfini le document de manire trs large : Les archives sont, [] des documents quels que soient leur date, leur forme et leur support matriel 164 . Force est de constater que ceci na pas pour autant instigu les juristes sintresser larchivistique. La conservation des documents ne les a jamais proccups outre mesure. Quant aux spcialistes en archivistique, lacception lgale large des archives a requis leur attention, mais ne les a pas trop inquits. La reconnaissance lgale de lcrit et de la signature lectroniques 165 a mis fin cette quitude aussi relative soit-elle. Le document numrique est admis par le lgislateur condition quil remplisse toutes les fonctions dvolues nimporte quel crit. Or la conservation constitue un pralable incontournable requis cet effet. Une telle condition nest gure tonnante. Noublions pas quon a dj tudi les caractristiques du support papier et inventori certaines mesures prendre aux fins dune efficace conservation des informations quil comporte. Ainsi, le stockage de lcrit classique parat moins compliqu que celui du document numrique. Lanciennet dont il bnficie par rapport ce dernier a permis ceux qui sintressent aux conditions de conservation des archives denvisager des solutions qui comblent ses failles. Ajoutons ceci que les difficults de stockage des archives numriques se posent toutes les phases de sa vie. peine voit-il le jour quun crit lectronique pourrait disparatre pour des raisons techniques. En outre, il nest pas exclu quune erreur humaine de manipulation des donnes numriques ne compromette leur intgrit. Le souci de savoir conserver les donnes numriques est
162. 163.

Nous emploierons indiffremment les termes crit , archives et documents . titre dillustration, les lgislateurs tunisien, franais et qubcois ont opt pour la multiplicit des supports des archives. 164. Premier article de la loi du 2 aot 1988 relative aux archives. 165. En Tunisie, cest en vertu de la loi modifiant certains articles du Code des obligations et des contrats du 13 juin 2000 que le lgislateur a admis lcrit et la signature lectroniques. Larticle 453 bis nonce : Le document lectronique est l'crit compos d'un ensemble de lettres et chiffres ou autres signes numriques y compris celui qui est chang par les moyens de communication condition qu'il soit d'un contenu intelligible, et archiv sur un support lectronique qui garantit sa lecture et sa consultation en cas de besoin. Le document lectronique fait preuve sil est [] renforc par une signature lectronique .

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 184/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

constant alors que pour lcrit sur support papier on se proccupait notamment de la conservation des archives dfinitives. Les dtenteurs des documents lectroniques ne peuvent que se rsoudre sintresser la conservation. Dsormais, le droit 166 positif aborde de manire explicite cette question. Les juristes sont interpells par cette opration qui devient plus inquitante pour plus dune catgorie demploys dont les spcialistes en archivistique. Excuter des obligations professionnelles de conservation nest gure nouveau pour eux, mais ils craignent fort que lavnement de lcrit numrique nalourdisse celles-ci. Sattarder sur la rglementation du stockage des documents (I) et des incidences du support lectronique sur lobligation de conservation (II) serait intressant pour comprendre cette suspicion lgard des aptitudes du support lectronique prserver ltat initial de lcrit.

La rglementation de la conservation Il serait important de dfinir le vocable conservation . Il signifie lopration matrielle, respectant des rgles juridiques, qui consiste assurer la sauvegarde dun droit (Cornu, Grard, 1987). Dun point de vue juridique, conserver lcrit implique ainsi son maintien dans son tat initial et sa prservation de toute altration. La norme ISO/15489 167 prcise que par conservation , on entend les actions et les tches concourant la prennit technique et intellectuelle des documents techniques 168 . Certes avant peu, la conservation na requis ni lintrt de la doctrine juridique ni celui du lgislateur, il nen demeure pas moins que le droit positif a tout le temps dict des obligations de conservation.
166. La loi-type de la Commission des Nations Unies pour le droit commercial international (CNUDCI) sur le commerce lectronique et Guide pour son incorporation de 1996 a consacr larticle 10 la Conservation des messages de donnes : Article 10. Conservation des messages de donnes Lorsqu'une rgle de droit exige que certains documents, enregistrements ou informations soient conservs, cette exigence est satisfaite si ce sont des messages de donnes qui sont conservs, sous rserve des conditions suivantes : a) L'information que contient le message de donnes doit tre accessible pour tre consulte ultrieurement ; b) Le message de donnes doit tre conserv sous la forme sous laquelle il a t cr, envoy ou reu, ou sous une forme dont il peut tre dmontr qu'elle reprsente avec prcision les informations cres, envoyes ou reues ; c) Les informations qui permettent de dterminer l'origine et la destination du message de donnes, ainsi que les indications de date et d'heure de l'envoi ou de la rception, doivent tre conserves si elles existent [] . Le lgislateur tunisien a trait expressment de la conservation plusieurs occasions ces dernires annes. Citons lexemple de larticle 4 de la loi n 2000-83 du 9 aot 2000 relative aux changes et au commerce lectroniques. Ainsi, il nonce dans lalina premier de la disposition en question que : La conservation du document lectronique fait foi au mme titre que la conservation du document crit . 167. ISO/DIS 15489, Records Management, 29/05/2000. 168. Ibid., p. 2.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 185/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Lexamen de lobligation professionnelle (A) ainsi que de ses sanctions (B) nous aidera comprendre ce paradoxe. Nous nous rfrerons cet effet principalement au cadre juridique tunisien 169 .
Obligations professionnelles de conservation

L obligation se dfinit comme un lien de droit en vertu duquel le crancier peut exiger du dbiteur quil accomplisse une prestation en sa faveur (Larrroumet, Christian, 2000). Tel est le sens lato sensu du terme obligation . Aussi, tre tenu dune obligation de conservation impliquerait-il, titre dillustration quun employeur exige de la personne qui est engage vis--vis de lui en vertu dun contrat de travail, de dployer tous les efforts requis et ncessaires pour que les documents quelle manipule soient prservs dans ltat o ils ont vu le jour. Avant daborder la porte de lobligation en question, une prcision dordre terminologique semble simposer. En effet, on remarque que les deux termes archivage et conservation sont employs indiffremment. Cest dans ce sens que lobligation de conservation est perue comme synonyme de lobligation darchivage. Est-ce que cette acception est correcte ? Sinon, est-ce que la diffrence entre les deux concepts appelle des consquences juridiques ? Pour lucider ce point, nous traiterons d'abord du cas o l'archivage constituerait l'objet de l'obligation de veiller maintenir le document dans son tat initial (1), ensuite nous examinerons le cas o il s'agirait plutt d'une obligation de conservation (2).
Une obligation darchivage

Il serait fructueux dessayer dtayer le point en question en se basant sur des textes juridiques. La loi n 88-95 du 2 aot 1988 relative aux archives nonce dans son premier article que : Les archives sont, au sens de la prsente loi, l'ensemble des documents quels que soient leur date, leur forme et leur support matriel produits ou reus par toute personne physique ou morale et par tout service ou organisme public ou priv, dans l'exercice de leur activit. Partant de cette disposition, l'archivage signifie donc l'action d'archiver 170 . Et, la lecture exgtique de la disposition lgale dfinissant les archives nous renseigne sur ce quest archiver. Cest la cration et la production de documents dans un cadre professionnel 171 .
169.

Prcisons que la dlimitation gographique du cadre juridique nest pas trs signifiante : les obligations de conservation et les difficults juridiques dcoulant du stockage de linformation lectronique font partie des problmes dactualit de lre numrique. 170. Nanmoins, le Littr dfinit ce verbe en ces termes : classer dans les archives , ce qui ne semble pas exprimer la teneur qua donne le lgislateur ce concept. En effet, classer ne reprsenterait quun maillon de la chane d'oprations requises pour le stockage de l'information.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 186/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Ce qui rvle le caractre important et dynamique de cette activit. De ce fait, dores et dj on peut affirmer que larchivage constitue une opration plus vaste que la conservation 172 . Cette opration ne peut concerner exclusivement les spcialistes dans la gestion des documents. Par contre, voquer une obligation darchivage reviendrait rendre obligatoire la cration ou encore la rception des documents par tous les employs. Ce qui pourrait sembler incongru et irraliste 173 . Il apparat donc qu Archivage et Conservation sont deux concepts distincts, ayant chacun sa propre dtermination. Ce qui nous amne plaider plutt en faveur de la conservation en tant quobjet de lobligation en question.
Une obligation de conservation

Il convient dabord de souligner la synonymie entre les termes stockage et conservation de l'information. Quimpliquerait une obligation professionnelle de conservation ? Celle-ci ferait peser sur les employs la charge de prserver les documents de la destruction (Littr). o Obligations de conservation incombant certains employs Pour lucider ce point, nous numrons de manire indicative certains domaines professionnels. Rappelons dabord que lobservation de lobligation en question permet au document de jouer son rle durant toutes les phases de sa vie. Il serait instructif de prciser tout dabord que le stockage des documents des entreprises tmoigne de leur existence mme, ainsi que de leur prennit surtout que toute personne morale (...) aspire vivre ternellement 174 . Par consquent, ses employs sont tenus de se conformer l'obligation de conservation. Ce qui justifierait la diligence requise pour la conservation des actes constitutifs de la socit ou encore des procs-verbaux de ses organes de dlibration. Par ailleurs, quand lentreprise est publique, celle-ci est assujettie explicitement une obligation de conservation. En effet, la loi n 88-95 du 2 aot 1988 relative aux archives nonce que tous les organismes publics ainsi que tous les gestionnaires de services publics sont tenus de se doter dun programme de gestion de leurs documents. Et, daprs le dcret n 88-1981 du 13 dcembre 1988, la bonne conservation fait partie du programme en question.
171.

Ainsi, l'emploi du terme prarchivage pour qualifier l'une des oprations accomplies par le gestionnaire des documents devient peu justifi. 172. Voir supra la dfinition du terme conservation. 173 . On dnombre plusieurs professions qui ne supposent gure la rception de documents et encore moins leur cration. 174. ric Dunberry, La Preuve et l'archivage des documents lectroniques, Montral, Wilson & Lafleur Ite, 2000, p. 21.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 187/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Force est de constater que tout employeur est aussi tenu en vertu du droit positif de conserver les archives affrentes la situation professionnelle de toutes ses ressources humaines 175 . Une telle exigence a pour finalit de prserver les intrts de toutes les personnes concernes. Sinon et dfaut dune liste exhaustive actualise des employs, comment pourrait-on plaider pour la constitution d'une commission consultative d'entreprise 176 ? Il devient patent que les fonctionnaires publics sont lis par une obligation gnrale de conservation lors de lexercice de leur mission Nanmoins, certains sont encore plus concerns par celle-ci. Citons titre dillustration : o Lobligation de conservation incombant aux employs de la conservation de la proprit foncire La loi mme assigne explicitement la fonction de stockage la conservation de la proprit foncire. C'est dans ce sens que le lgislateur prcise expressment dans l'article 316 du Code des droits rels La conservation de la proprit foncire [...] est charge :
de conserver les actes relatifs aux immeubles immatriculs .

Cette administration se charge donc de stocker tous les titres de proprit 177 . Cette mission n'est gure tonnante pour celle-ci et ce, de par mme son appellation 178 . Le Code des droits rels inventorie les documents conserver 179 . o L'obligation de conservation incombant aux receveurs des actes civils et des chefs des centres de contrle des impts En effet, les fonctionnaires en question sont tenus d'aprs l'article 90 du Code des droits d'enregistrement et de timbre de disposer d'un registre de formalit . Or, ce document laisse entendre une obligation de conservation.
Article 10 de la loi n83-112 du 12 dcembre 1983, portant statut gnral des personnels de l'tat des collectivits publiques locales et des tablissements publics caractre administratif : Le dossier individuel de l'agent public doit contenir outre les pices concernant son tat civil et sa situation familiale [] celles intressant sa situation administrative. Celles-ci doivent tre enregistres, numrotes et classes sans discontinuit. 176. Article 157 du Code de travail (modifi par la loi n94-29 du 21 fvrier 1994): Il est institu dans chaque entreprise rgie par les dispositions du prsent code et employant au moins quarante travailleurs permanents, une structure consultative dnomme commission consultative d'entreprise. 177. Article 359 : Les titres de proprit sont tablis sur des registres dont la forme est rgle par l'administration . 178. Il s'agit de la conservation de la proprit foncire . 179. Article 380 du Code des droits rels : La conservation de la proprit foncire tient, outre le registre des titres fonciers : - 1) un registre des demandes d'inscriptions et radiations... - 2) un registre de dpt tablissant le rsum des oprations dont l'inscription est accepte ainsi que la date de l'inscription.... A. Article 381 du Code des droits rels : Le registre des demandes d'inscription et le registre de dpt sont tenus en deux exemplaires dont l'un est dpos la cour d'appel dans le ressort de laquelle se trouve la direction rgionale dans les trente jours suivant la clture du registre . A. Article 383 du Code des droits rels : Le conservateur tient galement : - 1) une table alphabtique des titulaires des droits rels et des baux inscrits la conservation de la proprit foncire ; - 2) une table alphabtique des titres de proprit .
175.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 188/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

L'excution de l'opration de l'enregistrement implique l'insertion de certaines mentions : la date et le lieu de l'enregistrement, la nature de l'opration D'o la ncessit du respect du classement chronologique du registre du receveur 180 . Par ailleurs, les contrleurs d'impt exercent leurs prrogatives sur la base de certains documents. Ils doivent bien les garder dans leur tat initial pour justifier leurs dcisions. o L'obligation de conservation incombant aux gestionnaires des documents administratifs Les textes juridiques rgissant la matire en font mme le pivot de leurs attributions. En somme, le droit positif a bien englob des obligations de conservation, qu'elles soient explicites ou encore implicites. Cette affirmation peut tre conforte loccasion de lanalyse des sanctions de lobligation professionnelle de conservation (B).
Sanctions de lobligation de conservation

L'inobservation de l'obligation de conservation a requis lattention des pouvoirs lgislatif et rglementaire. C'est ainsi que l'article premier du dcret n 93-1451 du 5 juillet 1993 a prcis que : Tout agent relevant de ltat, des collectivits publiques locales et des entreprises publiques est responsable de tous les documents administratifs qu'il utilise dans l'exercice de son activit. Cette responsabilit concerne la circulation des documents, leur conservation et leur prservation. De quelle responsabilit s'agit-il ? Une responsabilit professionnelle : Le manquement une obligation de conservation par un fonctionnaire pourrait engendrer l'engagement de sa responsabilit professionnelle. Pour les officiers publics rgis par des statuts particuliers, il n'est pas exclu qu'on considre l'inobservation de l'obligation de stockage des documents qu'ils gnrent lors de l'accomplissement de leur mission comme une faute professionnelle. Ceux-ci seront ainsi passibles de sanctions disciplinaires 181 . Une responsabilit civile : dans le cas o l'inobservation de l'obligation de conservation cause un prjudice un particulier, rien ne l'empchera de demander sa rparation par le juge. Il
180. 181.

Rappelons que le classement fait aussi partie des fonctions archivistiques. titre d'illustration, rappelons juste que le dcret du 27 juin 1957, portant rorganisation de la profession de notaires, institution des huissiers-notaires et des clercs asserments inclut d'un titre pour la discipline. Il s'agit en l'occurrence du Titre I.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 189/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

faudrait indubitablement qu'il prouve le lien de causalit entre le dommage qu'il a subi et la faute commise par la personne tenue de stocker l'information en question. Une responsabilit pnale : l'article 160 du Code pnal dicte : Quiconque brle ou dtruit, d'une manire quelconque, des registres, minutes ou actes originaux de l'autorit publique, des titres, billets, effets de commerce contenant ou oprant obligation, disposition, dcharge, est puni de 5 ans d'emprisonnement et d'une amende de 1 000 francs. La tentative est punissable. Les termes de cette disposition sont gnraux mais rien ne s'opposera leur application aux personnes tenues d'une obligation de conservation. Il convient de rappeler que le lgislateur l'a confirm dans la loi n 88-95 du 2 aot 1988 o il a nonc expressment l'applicabilit des sanctions pnales en question ceux qui altrent volontairement les archives publiques ou encore prives 182 . Cette numration indicative porte sur les sanctions directes de la non-observation de lobligation de conservation. Le lien entre le stockage des documents et leur recevabilit par le juge pnaliserait fortement les personnes qui ne dploient pas les efforts requis pour dtenir leurs crits. En effet, larticle 87 du Code des droits d'enregistrement et de timbre nonce : Les juges ne doivent rendre aucun jugement sur la base d'actes non enregistrs . Si les documents qui leur sont soumis ne sont pas enregistrs, ils doivent surseoir les examiner. Et, mme si une rgularisation est envisageable cet effet, elle implique indniablement le stockage des documents par les parties concernes ou encore par tous les employs concerns. Ce qui illustre amplement l'impact de la conservation sur la prservation des droits des particuliers. Sinon, qu'est ce qui pourrait arriver de pire des auteurs d'actes juridiques contests dans leurs droits et privs de facto de la possibilit de se dfendre devant la justice ? La loi n2000-83 du 9 aot 2000 relative aux changes et au commerce lectroniques a raffirm la relation entre le stockage du document lectronique et les conditions dont tient compte le juge lors de son examen. Son article 4 traite du sujet en question et son troisime alina nonce : Le document lectronique est conserv sur un support lectronique permettant :
la consultation de son contenu tout au long de la dure de sa validit ; sa conservation dans sa forme dfinitive de manire assurer l'intgrit de son contenu ; la conservation des informations relatives son origine et sa destination ainsi que la date et le lieu de son mission ou de sa rception.
182.

Article 30 de la loi n88-95 du 02 aot 1988: Toute personne qui aura volontairement altr, falsifi ou dtruit tout document d'archives publiques ou d'archives prives est passible des sanctions prvues par les articles 160 et 163 du code pnal.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 190/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Le respect des exigences en question est trs important. Si lcrit lectronique nest pas conserv dans sa forme dfinitive par un procd fiable183 , le juge lui dniera toute force probante 184 . Donc, les auteurs des actes lectroniques ont non seulement intrt stocker leurs crits mais aussi veiller lefficacit de lopration. Mais, est-ce que leur volont est suffisante pour quils parviennent cette fin ? Rappelons que quand les citoyens sont lss dans leurs intrts, la scurit juridique est menace. Le jeune ge de lcrit lectronique pourrait tre lorigine dinterrogations ayant trait aux qualits propres au support numrique. Il nest pas tonnant, donc de se demander si ce dernier ne peut compromettre lexcution de lobligation de stockage par les employs. Rflchir sur les incidences du support sur lobservation de lobligation en question ne peut nullement tre dnu dintrt (II).

Incidences du support lectronique sur lobligation de conservation Nous traiterons cette question en deux temps : tout dabord en abordant les caractristiques techniques propres au support lectronique (A), puis en examinant les difficults juridiques qui en dcoulent (B).
Caractristiques techniques propres au support lectronique

Le support est insignifiant quant la ncessit du respect de lobligation de conservation. Rien dtonnant, car si le droit positif admet les archives indpendamment de leurs supports, il devient logique de les traiter indiffremment. Connaissant assez le support papier, ses qualits et ses failles, il devient donc plus opportun de sintresser au support lectronique. Deux points nous permettront dexaminer la question. Il sagit dabord danalyser les qualits du support eu gard lintangibilit de lcrit labor (1), ensuite dvaluer ses performances quant laccs au contenu du document (2).
Qualits du support eu gard lintangibilit de lcrit labor

Il ne faudrait donc pas altrer la qualit des archives pour qu'elles puissent remplir les diffrents rles qui leur sont assigns en fonction de leur ge. Quand elles sont actives ou
183. 184.

Second alina de l'article 453 bis du COC. Rappelons que le lgislateur franais a pos la condition aussi de la conservation de l'crit lectronique pour son lvation au rang de preuve littrale au mme titre que l'crit classique. Art. 1316-1 de la loi n2000-230 du 13 mars 2000.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 191/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

intermdiaires, elles devraient tre mme de prouver les allgations de toute personne physique ou morale concerne. Si elles sont dfinitives, leur intangibilit y va de la prservation du patrimoine du pays. cet effet, le support revtant le document en question doit incontestablement jouir des caractristiques suivantes : la durabilit, le caractre indlbile et le caractre infalsifiable. o La durabilit et le support lectronique La durabilit dun support fait appel essentiellement sa dure de vie ou encore ses performances pour que les donnes quil comporte restent dans ltat o elles avaient vu le jour. Nanmoins, il semblerait que le choix du systme informatique en tant que canal darchivage 185 ne garantisse pas une longue existence au document cr. Lexemple des disques optiques nous aidera tayer ce point. Leur choix nest pas fortuit car leur irruption sest accompagne dun discours emphatique vantant leurs vertus et spcialement leur dure de vie. Or, aprs quelques annes dutilisation des disques optiques, les constructeurs eux-mmes se sont raviss en limitant la durabilit du support en question une dcennie. Par ailleurs, la cryptographie ne rsiste pas leffet du temps. La prennit de la scurisation des donnes est trs relative. Des firmes amricaines offrant des services de scurisation des donnes changes via le systme informatique avouent les limites des moyens employs cet effet jusque-l. Seuls les algorithmes les plus longs et donc les plus coteux seraient 186 susceptibles de garantir une durabilit relativement plus longue ce processus de scurisation des donnes. o Le caractre indlbile et le support lectronique Pour que l'criture lectronique reste indlbile, cela suppose que l'ordinateur soit prmuni contre toute dficience technique. Les logiciels d'exploitation doivent tre parfaitement fonctionnels et surtout non vierges de tout virus. Il en va de mme pour les supports, qui, une fois dfectueux, ne permettent plus la lecture de l'crit. Ainsi, le caractre indlbile de l'crit lectronique dpend non seulement d'une certaine diligence humaine dans sa manipulation mais surtout de la qualit de la technologie utilise. o Le caractre infalsifiable et le support lectronique L infalsifiabilit suppose que le document conserv ne subisse aucune altration volontaire du fait de lhomme pour tromper les autres. Il sagit en loccurrence de lusage de
185.

Lemploi du terme archivage nest pas innocent, il laisse entendre toute lopration dynamique gnratrice du document. 186. Ces mthodes n'ont pas encore t suffisamment utilises pour tre values. Il n'est donc pas exclu que le temps rvle leurs limites.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 192/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

moyens frauduleux pour falsifier lcrit en faisant apparatre dautres donnes, qui, tout en passant pour vraisemblables, nen sont pas moins fausses. Or, loccasion de la production dune archive via le systme informatique, on peut changer certaines donnes et en rectifier dautres. Et ce notamment, quand il sagit de llaboration dun acte juridique lectronique qui suppose des ngociations entre les parties. Les informaticiens affirment que la restitution des donnes effaces est tout fait possible par toute personne malveillante. Et, selon eux, pour viter une telle situation, il faudrait prendre le soin de remplacer l'espace initialement rserv aux donnes non dsires par du vide. Une telle mesure requiert outre les cots quelle occasionne un savoir-faire pointu dont ne peut disposer quune infime lite. Il savre donc que les spcificits techniques du support lectronique nonces ci-dessus ne garantissent que de manire trs approximative lintangibilit du document numrique. Quen est-il de ses performances quant laccs son contenu ?

Performances du support lectronique quant laccs au contenu du document

Linformation peut tre contenue dans nimporte quel support pour autant que ce dernier permette tout moment laccs son contenu initial et intgral. Dans ce cas on peut le qualifier de lisible et dautonome. La lisibilit : un document est rput lisible quand on peut lire intgralement son contenu sans se confronter des difficults de dchiffrage. Lcrit numrique ne semble pas satisfaire cette exigence car il nest pas exclu que la codification des donnes soit lorigine de la perte dune partie de celles-ci. La compatibilit des logiciels utiliss serait en gnral le pralable requis pour toute lecture de larchive numrique. La spcificit de lquipement informatique ncessaire nest pas ngliger non plus. Lautonomie du document lectronique : rappelons que le papier, titre dexemple, permet laccs au contenu de lcrit quil comporte travers tout son cycle de vie dans le cas o on se comporte diligemment pour le conserver. Cependant, une lecture humaine nest pas possible pour le document numrique : un matriel informatique et un systme dexploitation compatibles sont requis pour toute matrise de son contenu. Mais, comme les systmes informatiques ainsi que les logiciels dexploitation sont en perptuel mouvement, laccs au document lectronique savre difficile dans toutes les phases de sa vie. La taille de lcueil augmente avec le temps.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 193/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Le support lectronique nest pas encore mme de garantir le maintien du document lectronique dans son tat initial et encore moins sa lecture travers toutes les tapes de sa vie. Ce qui est de nature engendrer des difficults juridiques quil serait instructif danalyser.

Incidences juridiques des qualits du support lectronique sur lexcution de lobligation de conservation

Si les spcificits du support lectronique peuvent mettre en pril lintangibilit de lcrit lectronique toutes les phases de sa vie, lobservation de lobligation professionnelle de conservation par les employs pourrait tre compromise. Ce qui ne manquerait pas dengendrer des difficults juridiques aussi bien pour les personnes assujetties lobligation en question que pour les citoyens. Cette ide mrite dtre illustre laide de quelques exemples concrets. La durabilit trs approximative du support lectronique peut tre lorigine de laltration, voire mme de la disparition des donnes stockes. Or, que ferait un employ pour faire valoir les droits de son entreprise si le document prouvant la crance tait radiqu cause de la dtrioration du disque optique ? Et, comment agir quand certaines informations seffacent du fait dune dfaillance technique quelconque ? Est-ce que sa diligence dans la protection des donnes et les qualits du support lectronique sont suffisantes pour que le professionnel concern ne soit pas sanctionn du fait de linobservation de lobligation de conservation ? Cette ventualit semblerait peu envisageable vu les caractres impersonnels et obligatoires de la rgle de droit. De ce fait, de manire gnrale, lemploy, et, en particulier, le spcialiste en archivistique, pourraient devoir affronter des difficults juridiques cause des failles propres au support lectronique. En outre, le risque de la disparition de la signature lectronique est trs proccupant ds lors quil touche la scurit juridique. Un acte juridique doit tre sign pour quon identifie ses auteurs qui, par ailleurs, reconnaissent avoir adhr son contenu. La signature appose sur un contrat doit exister tous les ges de lcrit. Son inexistence sur lcrit empchera ce dernier de sacquitter de ses multiples missions. Il perdra, par exemple, sa fonction probatoire et sera incapable de permettre aux particuliers de jouir paisiblement de leurs droits. En sus du dsarroi que provoquerait une telle situation chez des particuliers, certains employs tenus dune obligation de conservation risqueront fort de devoir rpondre du non-respect de celle-ci.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 194/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Le cas du receveur des actes civils serait fort difiant pour nous sensibiliser aux dangers probables des limites du support lectronique en matire de conservation des donnes. En effet, lorsque les parties perdent leurs crits, elles peuvent sadresser au receveur des actes civils pour quil leur fournisse une copie du document en question afin de sen prvaloir en justice. Laccomplissement de ce volet du rle du receveur des actes civils implique son observation de lobligation de conservation. Or, sa bonne volont suffira-t-elle justifier du non-respect de celle-ci quand il sagit dcrits lectroniques ? Cette question pourrait indubitablement proccuper le tiers archiviste aussi. Quant au rajeunissement des fichiers 187 prconis pour remdier lobsolescence technologique, il ne constitue gure la panace sur le plan juridique. La transcription des donnes peut tre lorigine de leur dnaturation. Laltration des informations stockes peut rsulter de fraudes, derreurs humaines ou encore de dfectuosits techniques. Ajoutons ceci, que la migration des fichiers radique la signature lectronique ce qui remet en question la confiance en lcrit lectronique et aggrave la situation des employs qui ne peuvent sacquitter convenablement de leurs obligations de conservation. Ces questions, et bien dautres, ont suscit lintrt de plus dun groupe de recherche, tel celui constitu et financ par la Communaut europenne. Il s'agit de lEuropean electronic signature standardisation initiative (EESSI) 188 form dans le but d'examiner les limites de la signature cryptographique en laborant des standards techniques ralisant les concepts de signature lectronique noncs par la Directive europenne 189 . Aussi propose-t-il la resignature pour remdier la prennit relative des procds cryptographiques. Ce qui revient prconiser la vrification de la signature lectronique en vue de s'assurer de son efficacit. L'EESSI a labor un document Electronic Signature Formats dans lequel est dfini un format de signature ES-A 190 . Ce dernier sert vrifier les signatures cres quelque temps auparavant. Il implique, par ailleurs, la compilation des informations suivantes : document original, signature, certificats, listes de rvocations, etc. Ces dernires servent la vrification ventuelle de la signature du document stock.
187.

Norme franaise NFZ 42-013, juillet 1999, Indice de classement: Z 42-013. p. 13. Recommandation 5.5.5 : Il convient de vrifier intervalles rguliers l'tat des informations enregistres. Il est recommand de copier les informations enregistres sur de nouveaux disques avant l'expiration de la dure de vie que le fabricant recommande pour le disque d'origine ou lorsqu'un dispositif de tests (logiciels conformes la norme ISO 12142 ou testeurs fournissant les valeurs de taux d'erreurs prciss dans la norme ISO 12024) fournit des informations indiquant que le support a des caractristiques hors des valeurs recommandes pour le stockage de donnes long terme. 188. On utilisera dornavant juste l'abrviation. Pour plus d'informations sur ce programme europen, consulter le site : <http://www.ict.etsi.org/EESSI_home.htm> [fvrier 2007]. 189. Guide pour la conservation des informations et des documents lectroniques moyen et long terme pour les tlprocdures, les intranets et les sites Internet p. 4. 190. Electronic signature formats ETSI TS 101 733 ( 122) - <http://etsi.org/> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 195/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

La resignature consisterait en lhorodatage de la structure compose par les donnes collectes et ci-dessus mentionnes. Cette opration n'est autre que la signature date d'une autorit d'horodatage 191 (Blanchette, Jean-Franois, 2000). Signalons aussi la formation dun autre groupe de recherche connu notamment par labrviation de sa dnomination International Resarch on Permanent Authentic Records in Electronic Systems 192 (InterPARES) qui se dmne en vue driger des principes directeurs devant servir au dveloppement des stratgies et des normes internationales pour la conservation long terme des archives lectroniques authentiques. Les chercheurs nont pas encore abouti des solutions radicales en vue dluder les insuffisances du support lectronique pour le stockage des donnes durant tout le cycle de vie de lcrit numrique. Dautre part, la conservation lectronique des documents a t traite dans les deux normes suivantes :
la norme NFZ 42-013 publie par lAfnor le 20 juillet 1999 la norme ISO/15489 Records Management .
193

La premire norme guide ceux qui conservent les documents lectroniques dans leur choix de l'quipement requis cet effet. Nanmoins, elle nest pas suffisamment rassurante quant la garantie de l'intgrit des crits en question. Les risques encourus par les actes lectroniques sont loin d'tre radiqus par l'application des recommandations nonces par la norme en question 194 . Quant la norme ISO/15489 Records Management , elle contribue mieux russir la conservation des documents lectroniques afin que puisse tre retrac leur contenu quand ncessaire. Mais, lappliquer ne permettra pas dviter les difficults juridiques auxquelles sont confronts tous les employs tenus dune obligation de conservation. Dailleurs, il est tonnant de constater que dans les textes en question, les difficults juridiques de la conservation des documents numriques ne sont pas abordes directement. Disposer dun document imputable lauditeur attitr et attestant des performances de lquipement informatique utilis nexcusera pas pour autant le spcialiste en archivistique qui ne peut fournir un document sign quand ncessaire.
191.

Jean-Franois Blanchette, Signature cryptographique et archivage lectronique, 15 avril 2001. <http://www.rpi.edu/> [fvrier 2007]. 192. Il existe deux InterPARES : InterPARES 1 a vu le jour en 1999 et a achev ses travaux en 2001. InterPARES 2 a t form en 2002 et projette de venir bout de sa mission en 2006. 193. Norme franaise NFZ 42-013, juillet 1999, Indice de classement: Z 42-013. Elle a t homologue par dcision du Directeur Gnral d'AFNOR le 20 juin 1999 et a pris effet un mois aprs, soit le 20 juillet. 194. D'ailleurs, la norme ne prtend gure rsoudre radicalement le problme de l'intgrit et de la fiabilit des documents stocks. 4.2 Options, p. 8 : Ces options, lorsqu'elles sont retenues, augmentent la capacit du systme garantir l'intgrit et la fiabilit des documents stocks dans celui-ci.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 196/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Si la loi qubcoise relative au cadre juridique des technologies de linformation aborde clairement la question de la conservation des documents et assujettit les personnes charges du stockage de linformation des obligations professionnelles, elle ne rsout cependant pas de manire efficace les risques quencourt le document lectronique travers toutes les tapes de sa vie.

Conclusion Le constat ayant trait aux difficults de la conservation du document lectronique ne peut tre que conjoncturel, faute de temps pour le connatre et le matriser. Dautre part, lhistoire nous enseigne que la recherche scientifique a constamment contribu surmonter les obstacles les plus importants dans plus dune discipline de la connaissance humaine. Comment ne pas esprer une solution pour perfectionner le support lectronique afin quil permette une parfaite conservation de lcrit lectronique travers toutes les phases de sa vie ? Le stockage de linformation numrique intresse aussi bien les juristes et les informaticiens, que les cryptologues. Les spcialistes en gestion des documents sont galement concerns par cette question. Des recherches pluridisciplinaires sont fortement indiques pour que lcrit lectronique puisse jouer son rle travers toutes les phases de sa vie. La conjugaison des efforts de toutes les comptences est requise incessamment. Lefficacit de la conservation du document lectronique touche la scurit juridique. Serait-il exagr de la considrer comme la clef de la confiance dans lre numrique ?

Bibliographie
Monographies LARROUMET, C., Les obligations , Rgime gnral, Paris, conomica, 2000. DUNBERRY, ., La Preuve et larchivage des documents lectroniques, Montral, Wilson & Lafleur Ite, 2000. CORNU, G., Vocabulaire juridique, Paris, Presses universitaires de France, 1987. ODDOS, J.-P., La Conservation : principes et ralits, Paris, ditions du Cercle de la librairie, 1995. JACQUESSON, A., Bibliothques et documents numriques : concepts, composantes, techniques et enjeux, Paris, ditions du Cercle de la librairie, 1999.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 197/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Articles de priodiques BULLOCK, A., La conservation de l'information numrique : ses divers aspects et la situation actuelle , FLASH Rseau n 60, Services de technologie de l'information, Bibliothque Nationale du Canada, <http://www.collectionscanada.ca/9/1/p1-259-f.html> [fvrier 2007] p. 1-7. CAPRIOLI, ., Contribution la dfinition d'un rgime juridique pour la conservation des documents : from paper to electronic message , Droit de linformatique et des tlcoms, n 3, 1993, p. 5-17. BOUILHOL, H., Aspects juridiques de l'archivage des moyens de paiement , Droit de l'informatique et des tlecoms, n 6, 1997. ANTOINE, M., ELOY, M., BRAKELAND, J.-F., avec la collaboration de Denis, S., Le droit de la preuve face aux nouvelles technologies de l'information : aspects techniques et juridiques du transfert et de la conservation des documents , Cahiers du Centre de recherches informatique et droit, 7 CRID, Facults universitaires Notre-Dame de la Paix de Namur, E. Story-Scientia, Namur, Bruxelles, 1992. Article sur site Web BLANCHETTE, J.-F., Signature cryptographique et archivage lectronique, 15 avril 2001. <http://www.rpi.edu/> [fvrier 2007]. Contribution dans une tude De LAMBERTERIE, I., Preuve, conservation, archivage , Une socit sans papier, Paris, La Documentation franaise, 1990, p. 240. Rapports et tudes Observatoire juridique des technologies de l'information, Une socit sans papier , Paris, La Documentation Franaise, 1990. Programme gnral d'information et UNISIST, Comment valuer les mesures de conservation matrielle ncessaires dans les bibliothques et les archives : une tude RAMP accompagne de principes directeurs, Paris, 1990. Confrence et journe dtudes Fdration internationale des associations de bibliothcaires et des bibliothques (IFLA), Professional Reports, n44, Actes de la confrence panafricaine sur la prservation et la conservation de matriels de bibliothques et d'archives, Nairobi, Kenya, 21-22 juin 1993, La Haye, Pays-Bas, Secrtariat de l'IFLA, 1995.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 198/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

La numrisation au service de la prservation et de la direction des archives de France , Valorisation des archives, Journes dtude de la Direction des Archives de France, Chlon-en-Champagne, 25-27 juin 1997, Paris, Direction des Archives de France, 1998. Guide Guide pour la conservation des informations et des documents lectroniques moyen et long terme pour les tlprocdures, les intranets et les sites Internet. Formats, supports, janvier 2001.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 199/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Rle de lauthenticit dans le cycle de vie des documents numriques


Eun G. PARK cole suprieure de bibliothconomie et de sciences de linformation Universit McGill

Rsum : Le concept dauthenticit est au centre de la cration et de la gestion des documents darchives. Tout en soulignant limportance de ces problmatiques, cet article se propose de suivre les diverses ramifications du concept dauthenticit tel quil peut sappliquer aux documents numriques et aux documents darchives diplomatiques, juridiques et informatiques. Il sagit par ailleurs dexaminer limpact de ce concept chaque phase du modle du cycle de vie. Il est en effet crucial de sassurer de lauthenticit des documents aux diffrentes tapes de leur cycle de vie, surtout lorsquon a affaire des environnements numriques. Des projets de recherche en cours, tel le Projet InterPARES, mettent en avant des exigences fonctionnelles touchant la gestion et au traitement des documents numriques. En conclusion, larticle en appelle logiquement une comprhension accrue de lauthenticit dans ses applications au modle du cycle de vie et la gestion des documents, y compris numriques.

Introduction : pourquoi lauthenticit ? lre numrique, il ny a pas lieu de stonner de lomniprsence des documents numriques dans les dossiers darchives constitus par les individus et les entreprises. Sur bien des plans, lutilisation de plus en plus frquente de linformation et des documents numriques a augment de manire significative les performances et lefficacit des organismes, tant publics que privs. Les nombreux avantages que prsentent les documents numriques ont transform en profondeur leur capacit matriser les processus mtier, les oprations de transmission et de communication, les environnements de travail, la gestion financire, lorganisation du personnel et la prise de dcisions. En mme temps, ces changements ont nanmoins fait surgir des problmes inattendus relativement la gestion de linformation, notamment dans des formats numriques. La frquence des oprations de transmission et de communication faisant intervenir ces derniers excde la capacit des entreprises grer les documents numriques et compromet ainsi, dans une certaine mesure, leur responsabilit quant lauthenticit des documents lectroniques.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 200/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

La notion dauthenticit a toujours jou un rle crucial dans la constitution des archives et la gestion documentaire, tant donn que les documents rcemment crs sont tous censs tre authentiques et que seuls ceux qui mritent ce qualificatif ont leur place dans les archives. Ce principe, toutefois, est considrablement fragilis par la vulnrabilit mme des documents numriques. Depuis quelques annes, la prpondrance du numrique dans les communications professionnelles oblige les responsables de la gestion documentaire revenir sur le concept dauthenticit dans la gestion des documents numriques, et lvaluer en fonction de lusage de ces documents conformment au modle du cycle de vie. Cet article consacr limportance du concept dauthenticit et aux problmes quil soulve, ltudie dans des domaines professionnels qui utilisent et traitent les documents numriques, tels les services darchives, la diplomatie, le droit ou les systmes informatiques. Ce faisant, il cherche aussi dterminer limpact du concept dauthenticit sur le cycle de vie des documents dans la gestion documentaire.
Les sens du mot authenticit

Le concept dauthenticit a derrire lui une longue histoire puisque ses dfinitions et son usage remontent lAntiquit grecque. Le Random House Unabridged Dictionary prcise que le mot authentique vient du mot authentiks, compos du prfixe aut ( racine ), du mot hentes ( celui qui fait , lauteur de laction) et du suffixe iks (-ique, marque de ladjectif). Toujours selon ce dictionnaire, est authentique ce qui est originel, premier et de premire main ; ni faux ni copi mais vrai, rel, vritable ; dune ralit incompatible avec le mensonge et la dformation ; dont lorigine est atteste par une preuve irrfutable ; authentifi, vrifi, favorablement accueilli ou cru parce que conforme lexprience ou des faits connus ; fiable ; fidle et exact . Dans les services darchives et de gestion documentaire, les documents authentiques sont ce quils sont censs tre : des documents fiables nayant pas t remanis, modifis ou corrigs au fil du temps (Dollar, 1999). Lauthenticit dun document garantit que depuis quil a t cr et transmis, si souvent que ce soit, divers destinataires, il na t ni modifi ni manipul aprs sa rception ou son envoi. Luciana Duranti ajoute quau sens o on lentend dans les services darchives, lauthenticit recouvre une ide de fiabilit maintenue aussi longtemps quun document est utilis, communiqu et conserv (Duranti, 1995). La diplomatie sest attache de longue date examiner non seulement la gense, les formes et la transmission des documents darchives, mais aussi leurs rapports avec les faits quils relatent et avec leurs auteurs, de faon identifier, valuer et communiquer leur nature vritable. Dans cette optique, un document est donc authentique lorsquil est ce pour quoi il se donne (Duranti, 1998), autrement dit lorsquil contient tous les lments conus pour sa prsentation. En consquence, lauthenticit a valeur de jugement absolu dans des

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 201/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

archives susceptibles dtre modifies tout moment du fait dune action ou de la migration des documents dans le temps. En droit, en revanche, lauthenticit est un critre de la preuve juridiquement admissible (Wright, 1998). La preuve, ici, dsigne tout ce qui peut exposer la vrit dun fait, dun point ou dune question, et sert de critre de jugement au cours du procs. La preuve prsente se doit donc dtre authentique et en rapport avec ce dont il est question. Ce pourquoi la justice exige aussi une attestation de la preuve prsente. Les professionnels du droit ont envisag les documents lectroniques dans la double perspective de la fiabilit des processus associs leur cration, et de la scurit des documents au moment de la transmission et de lchange des donnes (Wright, 1998). Laugmentation rapide du nombre des rseaux et des utilisateurs de lInternet rend ces questions de scurit tout aussi importantes. Ce concept est utilis depuis quelque temps pour indiquer que les processus mis en uvre pour assurer la scurit informatique et la scurit des donnes, garantissent que tout ce qui touche la tltransaction est authentique et que le message ne sera ni remani ni altr pendant la transmission (Lynch, 2000). Les informaticiens ont mis au point des techniques et des mcanismes de scurit, tels que le cryptage, les signatures numriques, les cls dites publiques, les techniques de hachage, la stganographie, le filigrane numrique, lencapsulation, la cryptographie, etc.

La gestion du cycle de vie des documents Cration et duplication Conservation et limination Systme dinformation numrique Organisation Recherche et rcuprations Utilisation

Fig. 1. Le cycle de vie des objets dans un systme dinformation numrique (Anne J. Gilliland Swetland, 2000).

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 202/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

La ncessit denvisager les documents en fonction de leur frquence dutilisation et de leur valeur a amen concevoir le modle de leur cycle de vie. Emprunt la biologie, ce modle adopt par les sciences de linformation comporte cinq tapes illustres par la figure 1 (GillilandSwetland et Eppard, 2000) : la cration et la duplication ; lorganisation ; la recherche et la rcupration ; la conservation et llimination. Selon Robek (1987), le cycle de vie des documents indique la dure de vie dun document au cours de six phases correspondant pour elle la cration, lorganisation, la recherche et la rcupration, lutilisation, au stockage et au maintien, la conservation ou llimination. Au dpart, les documents crs sont produits dans des formes et des formats trs divers, au moyen des techniques et du matriel disponibles. Ils sont ensuite organiss de manire systmatique et raisonne, par ajout dinformations descriptives (catalogage) et donc cration dune information secondaire. Les documents deviennent alors accessibles aux utilisateurs et aux bibliothcaires via les procdures de recherche et de rcupration. Lors de cette phase dutilisation et de diffusion, ils sont distribus et transmis aux personnes qui ont besoin de sen servir. Ils sont gnralement utiliss pour prendre des dcisions, des fins de documentation ou de rfrence, pour rpondre des enqutes ou satisfaire des exigences du droit. Avec le temps, ils connaissent le mme sort que la plupart des avoirs structurels : moins utiliss, ils perdent galement en valeur, deviennent moins ncessaires et finissent par tre carts. Si lon dcide de les garder pour quils puissent tre consults ultrieurement, il faut les entreposer et les protger au moyen dun mcanisme de stockage permettant den assurer la prservation. Lors de cette phase, il est toujours possible de demander les consulter ; ils sont encore frquemment cits et restent donc actifs. Quand leur valeur a tant baiss quils ne sont plus rclams, ils deviennent inactifs et entament la phase finale dlimination ou de rtention : retirs du dispositif de stockage actif, ils sont soit dtruits, soit transfrs dans une installation de stockage inactive o ils resteront pendant la dure de la rtention. La toute dernire tape de leur cycle de vie sachve sur leur destruction. Ceux qui prsentent une valeur prenne sont conservs dans un lieu de stockage pendant une longue priode. Il est essentiel de connatre la signification et limportance de chacune des phases qui composent le cycle de vie. Les responsables des services de documentation doivent matriser lensemble des paramtres indispensables pour correctement grer la vie des documents.
Authenticit et phases du cycle de vie

Quand est-il indispensable de pouvoir certifier lauthenticit des documents ? Lors de lacquisition, de la rception, de lindexation, de la mise disposition pour utilisation, ou de la conservation ? Quand on travaille dans des environnements numriques, les documents et donnes numriques tant dsormais accessibles et disponibles en tout temps et en tout lieu, quel que soit le

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 203/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

moment de leur cycle de vie o ils se trouvent , il devient difficile et certains gards absurde de diffrencier entre elles les diffrentes phases. chacune delles, il faut tre en mesure de garantir lauthenticit des documents. Autrement dit, puisque lauthenticit permet daffirmer que le document est bien celui que lutilisateur a demand consulter en se fiant une rfrence antrieure, et quil na pas t modifi depuis sa cration, toutes les tapes du cycle de vie son accessibilit, son maintien et sa conservation sont ncessaires. Dans le mme ordre dides, puisque lauthenticit atteste lintgrit des documents elle permet aussi, en amont, de vrifier la paternit des documents et dlaborer des stratgies conservatoires. Raison pour laquelle la garantie de lauthenticit des documents dans les environnements numriques rclame une approche intgre visant prciser les conditions qui sont au fondement de lauthenticit ainsi que les procdures de gestion des documents lectroniques, de leur valuation leur retrait par les utilisateurs. De la gestion la conservation : leffort que cela implique fait lobjet dun projet de recherche.

La mise en uvre exemplaire du Projet InterPARES I Denvergure internationale, le projet InterPARES (International project on Preservation of Authentic Records in Electronic Systems ; 1999-2002) est un projet de recherche auquel participent plusieurs institutions de plusieurs pays, qui travaillent en collaboration selon une approche pluridisciplinaire. Il associe une quipe canadienne, une quipe des tats-Unis, une quipe italienne, une quipe europenne, une quipe asiatique, une quipe australienne et une dernire reprsentant lindustrie au niveau mondial (CENSA). Il a donn lieu au projet InterPARES II (2002-2006), ax sur les documents interactifs et dynamiques ns de lexprience, et qui a pour objectifs : 1) dexaminer les questions lies la durabilit, laccessibilit et lutilit des systmes de documents lectroniques, ou lauthenticit des documents dans loptique de leur conservation long terme ; 2) de dfinir les procdures et les ressources, les stratgies et les normes ncessaires la conservation des documents lectroniques authentiques ; 3) didentifier et de modliser la forme, la fonction et la structure des systmes numriques, de leur contenu et de leurs mta donnes, afin de rpondre ces besoins. Les groupes de recherche sattachent prciser, dune part les conditions conceptuelles garantes de lauthenticit lors des oprations dvaluation et de conservation inhrentes la gestion documentaire, dautre part les mesures et les normes que devront respecter les professionnels du public et du priv (projet InterPARES). Le groupe de travail sur lauthenticit a mis au point un modle danalyse des systmes lectroniques et de lensemble des documents qui y sont rassembls en fonction des conditions garantes de lauthenticit des diffrents types de documents lectroniques. Il a travaill sur trentedeux tudes de cas pour analyser les conditions garantes dauthenticit dans les systmes de

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 204/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

documents lectroniques et dfinir les conditions et rfrences de base de lauthenticit (GillilandSwetland et Eppard, 2000). Lvaluation de lauthenticit des documents nest possible que si leurs caractristiques (attributs) et les liens tablis entre eux sont exprims de faon garantir leur identit et leur intgrit. De plus, laccessibilit et avec elle les procdures de scurit, les supports et la technologie utilise devraient tre prciss sur des formulaires crits afin de permettre lauthentification et lidentification des documents sources autoriss (projet InterPARES II, 2004). Il faut par ailleurs mettre en place des contrles rigoureux sur le transfert, le maintien et la reproduction des documents pour soutenir la production de documents authentiques. Do la recommandation dtablir des justificatifs propos du processus de reproduction et de ses effets (projet InterPARES, 2004).

Conclusion en juger par lampleur que le concept dauthenticit a pu prendre ces dernires annes dans la gestion des documents lectroniques, il ne fait pas de doute que la question de lauthenticit de ces derniers est dune extrme importance. Le but de cette prsentation tait de montrer que pour assurer la conservation de leur intgrit, il est indispensable de pouvoir certifier leur authenticit toutes les tapes de leur utilisation et de leur gestion. On sefforce lheure actuelle de prciser la dfinition de lauthenticit des documents, avec lespoir que ces recherches permettent bientt de franchir un pas dcisif et de trouver une solution pour garantir lauthenticit des documents numriques grce une gestion plus efficace et aux progrs technologiques.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 205/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Impact de lorganisation des documents lectroniques sur linterprtation de linformation organique et consigne 195 dans un contexte de gestion dcentralise
Sabine MAS cole de bibliothconomie et des sciences de linformation Universit de Montral
Rsum : Dans un contexte de gestion documentaire dcentralise, lorganisation des documents lectroniques est sous le contrle direct des employs. Il est reconnu que ces derniers organisent ces documents lectroniques selon des critres trs personnels qui sont le plus souvent incomprhensibles pour les autres employs, rendant difficile le reprage et linterprtation des documents. ce jour, cette assertion na pas t mise lpreuve empiriquement. Notre recherche se donne pour objet dtudier plus avant le lien entre le mode dorganisation des documents lectroniques et leur interprtation. Cette communication vise prsenter les lments contextuels et les bases thoriques relatives lorganisation des documents lectroniques dans un contexte de gestion dcentralise, avant de conclure sur les besoins au niveau de la recherche et limplication des rsultats en matire de gestion du cycle de vie des documents.

Introduction En prenant connaissance du thme du colloque organis conjointement par lEBSI-ENSSIB, il nous est apparu opportun de proposer une communication relative certains aspects de notre projet doctoral. Le sujet de ce projet doctoral peut apparatre loign de la thmatique de ce colloque, mais nous aimerions dmontrer dans le cadre de cette prsentation que lorganisation des documents lectroniques crs et utiliss dans les corporations, agences gouvernementales et autres organismes, peut avoir un impact sur la gestion du cycle de vie des documents dont le format technologique est numrique. Notre prsentation touche la classification des documents lectroniques ralise par les employs. La classification est une fonction archivistique importante car en contribuant lorganisation des documents, elle facilite le reprage et linterprtation tant des archives courantes
195

. Linformation organique et consigne est, selon C. Couture : cet lment de connaissance gnr dans le cadre des activits dune personne ou dun organisme (information organique) et que consigne le document darchives (information consigne) , cf. Les Fonctions de larchivistique contemporaine, Sainte-Foy, Presses de lUniversit du Qubec, 1999, p.115.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 206/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

et intermdiaires que des archives dfinitives 196 , elle contribue une gestion matrielle efficace du cycle de vie des documents, et elle participe la structuration de la mmoire institutionnelle (Gagnon-Arguin, L., et Bannouri, R., 1998 ; Hon, Gilles, 1999). Selon Statistique Canada (2001), environ un travailleur canadien sur deux (57 % en 2001) utilise un ordinateur dans le cadre de son emploi principal. Parmi ces travailleurs, 80 % utilisent lordinateur chaque jour. Le nombre de documents sous format numrique est sans cesse croissant et les individus passent de plus en plus de temps interagir avec ces documents dans le cadre de leurs activits quotidiennes (Langemo, M., 2002 ; Saffady, W., 2002 ; Sprehe, T.- J., McClure, C.R. et Zellner, P., 2002 ; Waldron, M., 2002 ; Dhrent, C., et alii, 2002 ; Henderson, S., 2003). Dans un contexte de gestion documentaire dcentralise, le gestionnaire de document perd le contrle sur ces documents. La responsabilit de la gestion de ces documents revient lemploy, qui na pas toujours le temps ni la formation suffisante pour utiliser les classifications institutionnelles, le cas chant, en vue de classer systmatiquement ses documents selon une logique qui soit comprhensible par tous. Que se passe-t-il en labsence de tout systme de classification uniforme des documents lectroniques ? Comment reprer et interprter ces documents ? Comment grer le cycle de vie de ces documents et assurer la dfense des droits de lorganisme ou le tmoignage de ces activits ? Lobjectif de cette communication est de prsenter les lments du contexte organisationnel et les principaux aspects thoriques sur lesquels sappuie notre recherche. Nous prsenterons ensuite le projet de recherche empirique qui est envisag avant de conclure sur limplication des rsultats en matire de gestion du cycle de vie des documents.

lments contextuels Lutilisation rpandue des micro-ordinateurs depuis le milieu des annes 1980 a amen une dcentralisation et une dmocratisation des fonctions de cration, dorganisation, de contrle, de manipulation et de diffusion des documents dont le format technologique est numrique (Tough, A., et Moss, M., 2003). Alors que traditionnellement, il appartient au responsable dun poste de
196

. Les trois stades du cycle de vie des documents qui sont crs ou reus dans le cadre des activits des organismes sont dsigns par les termes archives courantes pour les documents actifs, archives intermdiaires pour les documents semi-actifs et archives dfinitives pour les documents conservation permanente (Rousseau, J.- Y, Couture, C. et alii, 1994).

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 207/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

classement de procder lanalyse, la classification et lindexation des documents ou des dossiers quil dtient, cest dsormais aux employs, cadres, professionnels, techniciens ou secrtaires, que revient la responsabilit de manipuler et grer les documents lectroniques crs ou reus partir de leur poste de travail informatique (Bergeron, P., 1992 ; Berlin, L.- M. et alii, 1993 ; Kaptelinin, V., 1996 ; Gagnon-Arguin, L. et Bannouri, R., 1998 ; Roberge, M., 2002 ; Saffady, W., 2002). Pour rpondre au besoin duniformit dans la gestion des documents, les gestionnaires de documents prconisent lutilisation du plan de classification institutionnel dj conu pour lorganisation des documents sur support papier (Vigneau, A., 1995 ; Dhrent, C., et alii, 2002 ; Guercio, M., 2002 ; Tough, A. et Moss, M., 2003 ; Confrence des recteurs et des principaux des universits du Qubec, 2004). Ce schma de classification des documents institutionnels qui offre une structure uniforme et formelle facilite le reprage et la comprhension des documents travers le temps, facilite la gestion du cycle de vie des documents, et diminue limpact de la mobilit du personnel (Confrence des recteurs et des principaux des universits du Qubec, 1994 ; GagnonArguin, L. et Bannouri, R., 1998 ; Lvesque, M., 1998-1999 ; Hon, G., 1999 ; Sncal, S., 1999 ; Dhrent, C., et alii, 2002 ; Sprehe, T.- J., McClure, C.- R. et Zellner, P., 2002). Or, dans un environnement lectronique, le plan de classification institutionnel est rarement utilis par les employs qui mettent eux-mmes en place leur propre structure pour organiser les documents qui se trouvent sur leur poste de travail informatique personnel (Gagnon-Arguin, L. et Bannouri, R., 1998 ; Sncal, S., 1999 ; Tough, A. et Moss, M., 2003). Plusieurs raisons sont mentionnes dans la littrature pour expliquer lindividualisme qui caractrise lorganisation des documents lectroniques dans un contexte de gestion dcentralise :
labsence de motivation, de leadership et de ressources institutionnelles (Hedstrom, M., 1996 ; Sprehe, T.- J., McClure, C.- R. et Zellner, P., 2002) ; la quasi-absence de politiques, normes, mthodes et procdures de gestion intgre des documents lectroniques (Confrence des recteurs et des principaux des universits du Qubec, 1994 ; Karjalainen, A., et alii, 2000) ; labsence de formation et dencadrement des employs (Confrence des recteurs et des principaux des universits du Qubec, 1994 ; Kaptelinin, V., 1996 ; Sprehe, T.- J., McClure, C.- R. et Zellner, P., 2002) ; la complexit inhrente lutilisation du plan de classification institutionnel (Universit de Montral, 1995 ; Archives nationales du Canada, 1996 ; Saulnier, C., 1997-1998 ; Gagnon-Arguin, L. et Bannouri, R., 1998, p. 30 ; Lvesque, M., 1998-1999 ; Sncal, S., 1999 ; Patterson, G. et Sprehe, T.- J., 2002) ; leffort cognitif dans lacte de classifier et le manque de temps (Malone, T.- W., 1983 ; Boardman, R., 2001 ; Henderson, S., 2003).

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 208/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

En labsence dun cadre normalis ou dincitation institutionnelle, la manipulation des documents lectroniques se trouvant sur les postes des employs seffectue, le plus souvent, sans rgle, ni discipline (Skupsky, D.- S., 1999, p. 30).
Many personal computer users, however, have developed their own, often idiosyncratic approaches to file and media management. Directory and file names may be cryptic, giving little indication of either purpose or content. Subdirectories may be created haphazardly, with little regard for hierarchical relationships. Unrelated files may be stored in the same subdirectory, while related information is scattered among multiple subdirectories at several hierarchical levels. (Saffady, W., 2002, p. 148)

Alors que les crateurs et utilisateurs premiers des documents semblent sy retrouver (Chapman, H., 1999), lutilisation de ces stratgies personnelles dorganisation des documents lectroniques nous amne nous poser la question suivante : quen est-il de la capacit des employs dinterprter et donc dutiliser ces documents dans le cadre dun travail collaboratif ou lorsque les employs quittent lorganisation ou changent de fonctions ? Il est reconnu que labsence dorganisation systmatique et uniforme des documents lectroniques conduit des problmes tels que :
lparpillement des documents relatifs une mme affaire (Skupsky, D.- S., 1999), la difficult de reprage et dinterprtation lie au mode dorganisation individuel bas sur des critres trs personnels qui savrent le plus souvent incomprhensibles aux autres utilisateurs (Kwasnik, B.- H., 1991 ; Berlin, L.M., et alii., 1993 ; Kidd, A., 1994 ; Sellen, A. et Harper, R., 2001 ; Saffady, W., 2002 ; Bergman, O., Beyth-Marom, R. et Nachmias, R., 2003), la perte possible voire la destruction incontrle de documents (Skupsky, D.- S., 1999).

On peut galement sinterroger sur lefficacit de ces modes dorganisation dans le partage et la rutilisation de linformation consigne (Skupsky, D.- S., 1999), la dfense des droits et la conservation de la trace des activits de lorganisme (Hedstrom, M., 1996 ; Lvesque, M., 19981999). Toutefois, aucune tude na t mene ce jour afin de vrifier empiriquement ces assertions dans un contexte de travail. Notre recherche se veut une contribution la recherche exprimentale sur les modes d'organisation personnels des documents lectroniques dans les organismes et limpact de

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 209/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

lutilisation de ces modes dorganisation sur linterprtation, lexploitation, la gestion et la prservation de ces documents plus long terme. Comment ? En valuant limpact des modes dorganisation personnels des documents lectroniques sur linterprtation de linformation organique et consigne par les employs. Analyse de la littrature sur lorganisation des documents partir dune revue de la littrature dans divers domaines relis lorganisation des documents lectroniques (par exemple : archivistique, sciences de linformation, psychologie cognitive, interaction homme-ordinateur et communication), il est possible de dgager un modle conceptuel qui fait tat des connaissances thoriques et empiriques sur les principaux aspects de cette recherche. Ce modle adapt notre recherche reprend les lments essentiels du modle propos par Henderson (2003). Il se compose de trois principaux aspects interrelis entre eux. Il sagit de :
lagent cognitif (lemploy) ; lespace documentaire (qui se trouve sur le poste de travail de lemploy) ; linterface (qui permet lagent dinteragir avec son espace documentaire).

Figure 1. Modle conceptuel de lorganisation des documents lectroniques dans un contexte dcentralis adapt du modle de Henderson, S. (2003) et inspir de ceux de Wang, P. (1999), et Ingwersen, P. et Jrvelin, K. (2002).

Nous allons brivement voir chacun de ces aspects qui dfinissent le modle afin de pouvoir mettre en lumire certaines contradictions, lacunes et questionnements qui sont la base de notre recherche.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 210/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Les employs : comportement organisationnel et profil professionnel

Les recherches antrieures sur lorganisation des documents nous apprennent que les individus utilisent principalement deux stratgies dorganisation des documents, valables aussi bien dans lenvironnement papier que dans lenvironnement lectronique : les individus empilent ( piles ) les documents ou les classent ( files ), dpendant de leurs besoins personnels (Cole, I., 1982 ; Malone, T.- W., 1983 ; Barreau, D.- K., 1995 ; Whittaker, S. et Sidner, C., 1996). Par exemple : Lempilement des documents ( piling ) consiste principalement regrouper, sans ordre particulier et sans titre explicite, au mme endroit physique ou spatial, le plus souvent sous forme de pile, des documents nayant le plus souvent aucune relation entre eux (Cole, I., 1982). Ce comportement permet de se rappeler des choses urgentes faire, ou bien permet daccder trs rapidement aux documents en les ayant la porte de la main (Malone, T.- W., 1983 ; Hertzum, M., 1993 ; Kidd, A., 1994 ; Sellen, A. et Harper, R., 2001). Le classement des documents ( filing ) consiste fournir un effort rgulier pour classer les documents selon une structure logique de rpertoires ou dans des piles de documents relativement bien ordonnes et identifies (Malone, T.- W., 1983 ; Whittaker, S. et Sidner, C., 1996). Ce comportement permet essentiellement dorganiser de grandes quantits de documents en classant les documents qui peuvent tre rutiliss ultrieurement pour des besoins de rfrence, par exemple (Barreau, D.- K., 1995 ; Whittaker, S. et Sidner, C., 1996 ; Bergman, O., Beyth-Marom, R. et Nachmias, R., 2003 ; Henderson, S., 2003). Lidentification de ces deux comportements est utile dans le cadre de notre recherche car elle rend possible la catgorisation des modes dorganisation mis en place par les individus allant de modes dorganisation peu structurs ( piles ) des modes dorganisation fortement structurs ( files ) (Henderson, S., 2003). Lutilisation dun plan de classification institutionnel correspondrait ici un mode dorganisation fortement structur et comprhensible par tous. En effet, cette structure de classification hirarchique permet dorganiser les documents selon les fonctions et activits administratives et oprationnelles dans le cadre desquelles ils ont t crs ou reus, offrant ainsi des lments de contexte qui facilitent le reprage et la comprhension des documents travers le temps pour lensemble du personnel de lorganisme (Confrence des recteurs et des principaux des universits du Qubec, 1994 ; Gagnon-Arguin, L. et Bannouri, R., 1998 ; Hon, G., 1999 ; Sncal, S., 1999 ; Dhrent, C., et alii, 2002 ; Sprehe, T.- J., McClure, C.- R. et Zellner, P., 2002). Les recherches antrieures suggrent que le choix dune stratgie de classification mise en place par les individus peut tre influenc, entre autres, par la nature des tches raliser et lanciennet dans lemploi actuel (Henderson, S., 2003). La nature des tches raliser suggre

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 211/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

quun individu peut avoir besoin daccder plus frquemment certains types dinformation que dautres obligeant un niveau de formalisation lev du mode dorganisation des documents lectroniques en vue dun reprage efficace des documents. Lanciennet (ou les annes dexprience) dans le travail actuel est galement considre comme un facteur pouvant entraner une accumulation dune plus grande quantit de documents incitant lemploy consacrer des efforts limplantation dun mode dorganisation plus labor (Lansdale, M., 1988 ; Barreau, D.K., 1995 ; Whittaker, S. et Sidner, C., 1996 ; Jones, W., Bruce, H. et Dumais, S., 2002 ; Henderson, S., 2003). Nous avons vu quil est tabli que labsence de politique et de formation en matire de gestion des documents est galement un facteur qui encouragerait lindividualisme en matire de gestion dcentralise des documents. Ces assertions nont pas t vrifies statistiquement malgr le besoin de recherche formul ce niveau. La vrification du lien entre la nature des tches de lemploy, les annes dexprience et le niveau de formalisation de son mode dorganisation des documents lectroniques, pourrait tre vrifi dans le cadre de notre recherche. Le lien entre la connaissance de lemploy des politiques en matire de gestion des documents lectroniques, la formation reue en matire de gestion des documents et lutilisation du plan de classification pourrait tre galement vrifi empiriquement.
Linterface

En vue dorganiser, sauvegarder et retrouver ses documents lectroniques qui forment son espace documentaire personnel, lindividu interagit avec une interface galement dsigne dans la littrature sous le vocable de virtual workspaces (Kaptelinin, V., 1996) ou information workspaces (Henderson, S., 2003). Dans le cadre de leurs activits quotidiennes, les gens passent beaucoup de temps interagir avec linterface qui leur est propos en vue de crer un mode dorganisation des documents lectroniques qui soit le plus efficace, convivial et facile utiliser (Kaptelinin, V., 1996 ; Henderson, S., 2003). Depuis plusieurs dcennies, le paradigme organisationnel qui est utilis dans cette interface est hirarchique (Henderson, S., 2003). Le principe est simple et relativement intuitif : il sagit dorganiser et reprer les documents selon une structure hirarchique de rpertoires. Cette interface hirarchique possde des avantages cognitifs pour lindividu puisquil lui permet de reprer un document selon la localisation spatiale du rpertoire dans lequel se trouve class le document (Berlin, L.-M., et alii, 1993 ; Barreau, D.-K. et Nardi, B.-A., 1995). Par ailleurs, la position du document dans la hirarchie et lobligation de nommer les rpertoires et fichiers fournit de linformation smantique sur le document (Henderson, S., 2003).

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 212/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Cette interface hirarchique se prte trs bien limplantation du plan de classification institutionnel comme mode dorganisation des documents lectroniques. Elle permet lutilisation des catgories du plan pour nommer et organiser uniformment les rpertoires lectroniques (Dhrent, C., et alii, 2002 ; Tough, A. et Moss, M., 2003). Cependant, cet outil est longtemps rest sous-exploit dans lenvironnement lectronique en raison notamment de contraintes lies linterface elle-mme (par exemple, limitations dans le nombre de caractres dans les titres des rpertoires ou difficults dapplication de la codification numrique du plan de classification) (Saulnier, C., 1997-1998 ; Gagnon-Arguin, L. et Bannouri, R., 1998). Cette interface hirarchique qui apparat idale pour des fins darchivage ne semble pas toujours comprise et utilise par les individus (Marsden, G. et Cairns, D.-E., 2003). Il na pas t non plus clairement dmontr que lutilisation dune classification strictement hirarchique est approprie pour organiser les documents (Barreau, D.-K., 1995 ; Sncal, S., 1999 ; Dourish, P., 2000). Beaucoup de recherches ont t ralises et continuent tre menes pour tenter de changer le paradigme hirarchique de cette interface (Freeman, . et Gelernter, D., 1996 ; Robertson, G., et alii, 1998 ; Dourish, P., et alii, 1999 ; Rekimoto, J., 1999 ; Bergman, O., Beyth-Marom, R. et Nachmias, R., 2003). Dans le cadre de notre recherche, nous ne voulons pas justifier lutilisation dune interface hirarchique ou au contraire, en faire la critique, nous voulons observer comment les gens interagissent avec cette interface pour organiser leurs documents et en quoi les modes dorganisation mis en place sous cette interface permettent linterprtation et le reprage des documents par autrui.
Lespace documentaire : format technologique et valeur probante

Dans le cadre de leur travail, les employs utilisent diffrents formats technologiques (document papier, courriels, pages web, documents bureautiques, etc.) qui constituent leur espace documentaire (Gagnon-Arguin, L., 1999). Ces diffrents formats technologiques sont le plus souvent organiss selon diffrents systmes ou applications. La revue de la littrature 197 nous apprend que les recherches prcdentes relatives lorganisation des documents se sont le plus souvent limites un seul format technologique en raison de la difficult de la dmarche et de lanalyse cause par cette diversit doutils dorganisation ou des besoins (Henderson, S., 2003). Dans le cadre de notre recherche, nous nous restreignons ltude de lorganisation des documents
197.

Plusieurs tudes se sont intresses la faon dont les individus organisent leurs documents papier (Cole, I., 1982; Malone, T.- W., 1983; Suchman, L., et Wynn, E., 1984; Lansdale, M., 1988; Kwasnik, B.- H., 1989; Blomberg, J., Suchman, L., et Trigg, R., 1994; Whittaker, S., et Hirschberg, J., 2001), leurs courriels (Whittaker, S., et Sidner, C., 1996), leurs pages web (Abrams, D., Baecker, R., et Chignell, M., 1998; Jones, W., Dumais, S., et Bruce, H., 2002) et leurs documents lectroniques (Carroll, J.- M., 1982; Kidd, A., 1994; Barreau, D.- K., 1995; Barreau, D. - K., et Nardi, B.- A., 1995; Kaptelinin, V., 1996; Chapman, H., 1999; Boardman, R., 2001; Ackerman, M.- S., et alii, 2003 ; Henderson, S., 2004).

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 213/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

lectroniques crs par des applications bureautiques, composs dun ou de plusieurs fichiers informatiques, et qui sont localiss sur le poste de travail des employs. La raison de ce choix est lie au fait que presque tous les documents de bureau sont depuis quelques annes crs grce loutil lectronique et ne sont plus systmatiquement imprims sur papier ou enregistrs sur un serveur (Skupsky, D.-S., 1999 ; Dhrent, C., et alii, 2002 ; Patterson, G. et Sprehe, T.-J., 2002 ; Confrence des recteurs et des principaux des universits du Qubec, 2004). Les documents lectroniques qui sont sous le contrle direct de lemploy possdent plusieurs caractristiques, releves dans la littrature, qui apparaissent parfois contradictoires : Dune part, il est dit que, dans un contexte de travail, une grande partie de linformation consigne sur support lectronique demeure informelle et officieuse (brouillons, annotations, versions prparatoires) (Karjalainen, A., et alii, 2000 ; Dhrent, C., et alii, 2002). Ces documents sont le plus souvent utiliss comme outils de production ou reproduction de documents imprims sur papier pour des besoins ergonomiques ou juridiques (ncessitant une signature manuscrite) (Hertzum, M., 1993 ; Hackett, Y., 1997 ; Dhrent, C., et alii, 2002) Dautre part, il est reconnu que certains documents possdent une valeur administrative, financire ou lgale pour les organismes et sont essentiels pour la poursuite de leurs activits (Berlin, L.-M., et alii, 1993) et la dfense de leurs droits (Saulnier, C., 1997-1998). Parmi ces documents, la plupart ont galement une valeur historique et font alors partie de la mmoire corporative (Dhrent, Catherine et collaborateurs, 2002). Cette assertion est appuye par le fait que de plus en plus de documents sont uniquement sur support lectronique et sont soumis des dlais de conservation. La proportion des documents possdant une valeur (dans le sens dutilit institutionnelle ou historique) et qui se trouvent sur le poste de travail des employs nest donc pas clairement tablie empiriquement. Les tudes empiriques tablissent une typologie des documents selon la dimension temporelle de linformation consigne sur support lectronique plutt que selon sa dimension probante ou historique. Les recherches de Cole (1982) et de Barreau & Nardi (1995) ont permis didentifier trois types dinformations consignes sur support papier ou sur support lectronique : laction information, soit linformation dintrt trs court terme et dont la dure de vie est de quelques heures ou quelques jours, la working information, soit linformation pertinente pour une tche, un projet ou une activit et qui est utilise pendant plusieurs semaines voire plusieurs mois et larchived information, soit linformation de rfrence qui peut tre conserve pendant plusieurs mois ou annes sur le poste de travail des employs (Berlin, L.- M., et alii, 1993 ; Henderson, S., 2003). Cette typologie qui sapparente aux trois ges du cycle de vie des documents darchives permet de supposer que les documents dfinis comme vhiculant de laction information et de la working information ont une valeur administrative, financire ou lgale trs forte. En ce qui

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 214/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

concerne, larchived information, sa valeur nest pas clairement tablie et semble varier selon la nature des tches de lemploy. Cette typologie est donc base sur la pertinence et la frquence dutilisation des documents du point de vue de lindividu. En aucun cas, elle ne tient compte de la valeur de ces documents pour lorganisme et par consquent, des obligations administratives, lgales, financires ou historiques, relatives leur conservation. Quelle que soit la valeur probante ou historique de ces documents, la gestion efficace du cycle de vie et la survie de ces documents ne semblent pas assures puisque leurs rdacteurs les effacent, en gnral, au moment de leur dpart, indpendamment des dlais de conservation dont ils peuvent faire lobjet (Dhrent, Catherine et collaborateurs, 2002). Cette situation est renforce par le fait que de nombreuses personnes pensent que les documents lectroniques ne sont pas rgis par les lois sur les archives, ou ont du mal faire une distinction entre les documents darchives lectroniques et les autres sources dinformation lectronique (Dhrent, C., et alii, 2002 ; Langemo, M. 2002 ; Sprehe, T.-J., McClure, C.-R. et Zellner, P., 2002). On peut ainsi sinterroger sur lefficacit de ces modes personnels dorganisation dans la dfense des droits et la conservation de la trace des activits de lorganisme (Hedstrom, M., 1996 ; Lvesque, M., 1998-1999).

Projet de recherche empirique partir de ces diffrentes observations et interrogations, le besoin demeure de poursuivre la recherche dans le domaine de lorganisation personnelle des documents lectroniques. Notre projet de recherche vise plus prcisment valuer limpact des modes dorganisation des documents lectroniques produits ou reus par les employs sur linterprtation des documents. Nous prsentons brivement dans la section suivante les bases empiriques et lorientation gnrale de cette recherche. Plusieurs recherches ont permis dobtenir des donnes qualitatives sur les modes dorganisation personnels des documents lectroniques ainsi que sur les facteurs influenant le choix de ces modes dorganisation (Nardi, B.-A., Anderson, K. et Erickson, T., 1994 ; Barreau, D.K., 1995 ; Kaptelinin, V., 1996 ; Chapman, H., 1999 ; Boardman, R., 2001 ; Henderson, S., 2004). Par exemple, la recherche de Barreau (1995) identifie les facteurs qui influencent les dcisions classificatoires des individus dans un environnement lectronique. Ltude de Chapman (1999) explore les diffrentes stratgies utilises par les individus pour nommer et organiser leurs documents lectroniques et cherche dcouvrir les raisons pour lesquelles ces stratgies sont utilises. Boardman (2001) et Henderson, S., (2004) sintressent aux stratgies de classification qui

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 215/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

sont privilgies par les individus et leur catgorisation base sur lorganisation de la structure de rpertoires et les noms des fichiers. Lutilisation dune approche essentiellement qualitative dans le cadre de ces recherches a permis de retracer le processus cognitif qui est en oeuvre dans lorganisation des documents et de dresser une vue plus approfondie des pratiques dorganisation des documents dans un environnement lectronique (Barreau, D.-K. et Nardi, B.-A., 1995). Nous pensons que ces travaux constituent une base solide partir de laquelle il est possible dentreprendre une approche quantitative en vue de vrifier empiriquement les assomptions releves dans la littrature concernant lorganisation des documents lectroniques. Les rsultats de ces tudes sont utiliss dans notre recherche pour structurer une plus large enqute sur les modes dorganisation personnels des documents lectroniques et une exprimentation visant mesurer leur impact sur linterprtation des documents dans un contexte de travail. Notre but est dobtenir des donnes quantitatives sur les caractristiques et lutilisation des modes dorganisation personnels des documents lectroniques pour complter les donnes essentiellement qualitatives des prcdentes tudes. La collecte de donnes visera :
obtenir un portrait gnral de lorganisation des documents lectroniques dans un contexte de gestion dcentralise parmi une population donne (sondage) ; valuer de manire plus spcifique limpact de diffrents modes dorganisation des documents sur linterprtation des documents (exprimentation).

Les donnes proviendront des sources suivantes :


Employs. Lanalyse portera sur les modes dorganisation des documents lectroniques mis en place par diffrents groupes demploys (par exemple, des secrtaires et des gestionnaires), la fois experts et novices dans lutilisation dun ordinateur, en vue didentifier les rgularits travers les modes dorganisation mis en place selon la nature des tches et lexprience des individus dans lutilisation dun ordinateur. Interface. Les dernires annes ont t marques par linnovation et limplantation dune varit dinterfaces alternatives au paradigme hirarchique. Afin de contrler limpact de linterface sur le mode dorganisation mise en place par un individu et de pouvoir effectuer des comparaisons entre ces diffrents modes dorganisation des documents, nous nous limiterons linterface conventionnelle hirarchique propose par le systme dexploitation Windows, soit lExplorateur Windows, en raison de son utilisation prdominante par les employs dans les corporations, agences gouvernementales et autres organismes.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 216/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Espace documentaire. Lanalyse portera sur linformation organique et consigne sur support lectronique, cre par des applications bureautiques (logiciels de traitement de texte, chiffriers, etc.) voire des bases de donnes, et qui est sous le contrle direct de lemploy.

La mthodologie envisage permettra de vrifier lhypothse gnrale de cette recherche, savoir quun mode dorganisation des documents lectroniques formellement bas sur les activits et les fonctions de lagent producteur et utilisateur des documents et des dossiers influence favorablement linterprtation de linformation organique et consigne. Ce faisant, cette recherche vise notamment identifier le mode dorganisation des documents lectroniques qui rpond le mieux aux besoins des employs en matire dinterprtation documentaire, daider les organismes dfinir des stratgies, de permettre la communaut archivistique de cibler des initiatives et didentifier les besoins en formation des employs impliqus dans lorganisation de linformation organique consigne sur support lectronique.

Conclusion Les responsables de la gestion documentaire tentent de sensibiliser depuis plusieurs annes les employs de bureau au fait que les documents quils produisent sur support lectronique et qui sont conservs sur leur poste de travail doivent tre rigoureusement classs selon le plan de classification institutionnel. Lassomption sous-jacente cette dmarche est que tout mode dorganisation des documents lectroniques, mme personnel, doit tre le plus efficace et comprhensible possible dans un contexte de travail et que tout document, quel que soit son support, doit tre systmatiquement intgr, ds sa cration, un programme de gestion des documents afin dassurer le suivi de son cycle de vie. Sil peut tre tabli empiriquement que ces documents lectroniques possdent une valeur probante, voire un intrt historique, et que les modes dorganisation mis en place par les employs eux-mmes ne sont pas quivalents en terme defficacit dans le reprage et linterprtation des documents, et donc dans leur exploitabilit et prservation long terme, cette information peut savrer trs utile pour des recommandations futures en matire de gestion du cycle de vie et darchivage de documents. Cest dans le cadre de cet objectif que cette recherche est ralise.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 217/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Remerciements Je tiens remercier Louise Gagnon-Arguin, professeure associe lcole de bibliothconomie et des sciences de linformation de luniversit de Montral, davoir bien voulu commenter ce texte.

Bibliographie
ABRAMS, D., BAECKER, R. et CHIGNELL, M., Information archiving with bookmarks: personal web space construction and organization , in Proceedings of CHI'98, 1998, p. 41-48. ACKERMAN, M.- S., et alii, Surviving the information explosion: How people find their electronic information, MIT Laboratory for Computer Science, 2003, p. 551-552. Archives nationales du Canada, Gestion des documents lectroniques dans un environnement de travail lectronique, Division des normes et pratiques lies la gestion de l'information, Ottawa, 1996. BARREAU, D.-K., Context as a factor in personal information management systems , Journal of the American Society for Information Science, vol. 46, n5 (1995), p. 327-339. BARREAU, D.-K. et NARDI, B.-A., Finding and reminding: file organization from the desktop , SIGCHI Bulletin, vol. 27, n3 (1995), p. 39-43. BERGERON, P., La gestion des archives lectroniques : quelques questions-cls considrer , Archives (Revue de l'Association des archivistes du Qubec), vol. 23, n3 (1992), p. 51-70. BERGMAN, O., BEYTH-MAROM, R. et NACHMIAS, R., The user-subjective approach to personal information management systems , Journal of the American Society for Information Science and Technology, vol. 54, n9, 2003, p. 872-878. BERLIN, L.-M., et alii, Where did you put it? Issues in the design and use of a group memory , Proceedings of INTERCHI'93, 1993, p. 23-30. BOARDMAN, R., Multiple hierarchies in user workplace , Proceedings of CHI 2001, 2001, p. 403404. CARROLL, J.-M., Creative names for personal files in an interactive computing environment , International Journal of Man-Machine Studies, n16, 1982, p. 405-438. CHAPMAN, H., The file naming habits of personal computer users, University of North Carolina at Chapel Hill, 1999.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 218/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

COLE, I., Human aspects of office filing : implications for the electronic office , in Proceedings of the Human Factors Society, 26th Annual Meeting, Santa Monica, California, Seattle, Washington (1982), p. 59-63. Confrence des recteurs et des principaux des universits du Qubec , in La Gestion des archives informatiques, Sainte-Foy, Qubec, Presses de l'Universit du Qubec, 1994. Confrence des recteurs et des principaux des universits du Qubec , in La Gestion des documents numriques des tablissements universitaires du Qubec : tat de situation et planification stratgique, 2004. COUTURE, C., L'valuation , in Les Fonctions de l'archivistique contemporaine, chap. 4, SainteFoy, Qubec, Presses de l'Universit du Qubec, 1999, p. 103-143. DHRENT, C., et alii, Les Archives lectroniques : manuel pratique, Paris, Direction des Archives de France, 2002. DOURISH, P., et alii, Using properties for uniform interaction in the Presto document system , Proceedings of the 12th annual ACM symposium on User Interface Software and Technology (UIST'99), Asheville, NC, ACM, 1999. DOURISH, P., et alii, Extending document management systems with user-specific active properties , ACM Transaction on Information Systems, vol. 18, n2, 2000, p. 140-170. FREEMAN, . et GELERNTER, D., Lifestreams : A storage model for personal data , in SIGMOD Record, vol. 25, n1, 1996, p. 80-86. GAGNON-ARGUIN, L. et BANNOURI, R., La Classification des documents institutionnels dans les ministres du gouvernement du Qubec et le dfi informatique : rapport de recherche, Montral, cole de bibliothconomie et des sciences de l'information, 1998. GAGNON-ARGUIN, L., La cration , in Les Fonctions de l'archivistique contemporaine, chap. 3, Sainte-Foy, Qubec, Presses de l'Universit du Qubec, 1999, p. 69-101. GUERCIO, M., Records classification and content management : old functions and new requirements in the legislations and standards for electronic record-keeping systems , Proceedings of the DLM Forum 2002, Access and preservation of electronic information : best practices and solutions, Barcelona, Luxembourg, Office for Official Communications of the European Communities, 2002. HACKETT, Y., Le programme relatif aux documents informatiques aux Archives nationales du Canada , Les Archives : un lieu de conservation, de mmoire et d'information, actes du 26e congrs de l'Association des archivistes du Qubec, Aymler, 1997, p. 163-173.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 219/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

HEDSTROM, M., Electronic records research issues. A summary of recent research , Invitational Conference on Electronic Records, University of Michigan, 1996. HENDERSON, S., Information workspaces , in Proceedings of OZCHI 2003 : New direction in interaction : Information environments, media & technology, 26-28 November 2003, University of Queensland, Brisbane, Australia, 2003. HENDERSON, S., Personal digital document management , Proceedings of APCHI, 2004. HON, G. La classification , in Les Fonctions de l'archivistique contemporaine, chap. 6, Sainte-Foy, Qubec, Presses de l'Universit du Qubec, 1999, p. 219-254. HERTZUM, M., Information retrieval in a work setting : A case study of the documentation part of chemists' work , Proceedings of the 16th IRIS, Information Systems Research Seminar in Scandinavia, Copenhagen, Denmark, University of Copenhagen, 7-10 aot 1993, p. 786-798. INGWERSEN, P. et JARVELIN, K., The turn: integration of information seeking and information retrieval in context , Fourth Libraries in the Digital Age Conference: Integrating Information Seeking and IR, Dubrovnik, 21-24 May 2002. JONES, W., DUMAIS, S. et BRUCE, H., Once found, what then? : a study of "keeping" behaviors in the personal use of web information , in American Society for Information Science and Technology (eds.), ASIST 2002 : Information, connections and community. Proceedings of the 65th ASIST Annual Meeting. Wyndham Franklin Plaza Hotel, Philadelphia, PA, Medford (New Jersey), Information Today, Inc., 2002, p. 391-402. KAPTELININ, V., Creating computer-based work environments : An empirical study of macintosh users , in Proceedings of the 1996 ACM SIGCPR/SIGMIS Conference on Computer personnel research, Denver, Colorado, ACM Press, 1996, p. 360-366. KARJALAINEN, A., et alii, Genre-based metadata for enterprise document management , Proceedings of the 33rd Hawaii International Conference on System Sciences (HICSS 2000), 2000. KIDD, A., The marks are on the knowledge worker , Proceedings of Human Factors in Computing Systems CHI'94 Celebrating Interdependence, Boston, Mass., U.S., ACM Press, 1994, p. 186-191. KWASNIK, B.-H., How a personal documents intended use or purpose affects its classification in an office , Proceedings of the twelfth annual international ACM SIGIR conference on research and development in information retrieval, Cambridge, Mass., U.S., ACM Press, 1989, p. 207-210. KWASNIK, B.-H., The importance of factors that are not document attributes in the organisation of personal documents , Journal of Documentation, vol. 47, n4, 1991, p. 389-398.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 220/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

LANGEMO, M., Winning strategies for successful records management programs: Proven strategies for developing new programs and improving existing ones, Denver, Colorado, Information Requirements Clearinghouse, 2002. LANSDALE, M., The psychology of personal information management , Applied Ergonomics, vol. 19, n1 1988, p. 55-66. LVESQUE, M., Les documents lectroniques et le calendrier de conservation ou les considrations d'un pauvre archiviste qui essaie de suivre l'volution technologique , Archives (Revue de l'Association des archivistes du Qubec), vol. 30, n3-4, 1998-1999, p. 39-54. MALONE, T.-W., How do people organize their desks? Implications for the design of office information systems , ACM Transactions on Office Information Systems, vol. 1, n1, 1983, p. 99-112. MARSDEN, G. et CAIRNS, D.- E., Improving the usability of the hierarchical file system , Proceeding of SAICSIT, ACM Press, 2003. NARDI, B.-A., ANDERSON, K. et ERICKSON, T., Filing and finding computer files, Cupertino, Apple Computer Inc., 1994. PATTERSON, G. et SPREHE, T.-J., Principal challenges facing electronic records management in federal agencies today , Government Information Quarterly, vol. 19, 2002, p. 307-315. REKIMOTO, J., Time machine computing: a time-centric approach for the information environment , Proceedings of UIST'99, 1999, p. 45-54. ROBERGE, M., LEssentiel de la gestion documentaire, Qubec, ditions GESTAR, 2002. ROBERTSON, G., et alii, Data Mountain: Using spatial memory for document management , Proceedings of UIST'98 (1998), p. 153-162. ROUSSEAU, J.-Y., COUTURE, C., et alii, Les Fondements de la discipline archivistique, Sainte-Foy (Qubec), Presses de l'Universit du Qubec, 1994. SAFFADY, W., Managing electronic records, Prairie Village (Kansas), ARMA International., 2002. SAULNIER, C., Prolgomnes la gestion des documents administratifs lectroniques , Archives (Revue de l'Association des archivistes du Qubec), vol. 29, n1, 1997-1998, p. 57-75. SELLEN, A. et HARPER, R., The Myth of the paperless office, Cambridge (Mass.), MIT Press, 2001.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 221/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

SNCAL, S., La Notion de classification et l'utilisation d'un plan de classification pour la gestion des documents dans un environnement lectronique, Hydro-Qubec, 1999. SKUPSKY, D.- S., Applying records retention to electronic records , The Information Management Journal, vol. 33, n3, 1999, p. 28-35. SPREHE, T.-J., McCLURE, C.- R. et ZELLNER, P., The role of situational factors in managing U.S. federal recordkeeping , Government Information Quarterly, vol. 19, 2002, p. 289-305. Statistique Canada, Utilisation de lordinateur au travail , Le Quotidien, mercredi 23 mai 2001. SUCHMAN, L. et WYNN, E., Procedures and problems in the office , Office Technology and People, vol. 2, 1984, p. 134-154. TOUGH, A. et MOSS, M., Metadata, controlled vocabulary and directories: electronic document management and standard for records management , Records Management Journal, vol. 13, n1, 2003, p. 24-31. Universit de Montral, Service des archives, Guide de gestion des archives informatiques de l'Universit de Montral : volet bureautique (environnements IBM et Macintosh), Montral, Presses de l'Universit de Montral, 1995. VIGNEAU, A., Les documents informatiques : pour une classification efficace , Archives (Revue de l'Association des archivistes du Qubec), vol. 27, n3, 1996, p. 29-47. WANG, P., Methodologies and methods for user behavioral research , Annual Review of Information Science and Technology (ARIST), vol. 34, 1999, p. 53-99. WHITTAKER, S. et SIDNER, C., Email overload: exploring personal information management of email , Proceedings of CHI'96, 1996. WHITTAKER, S. et HIRSCHBERG, J., The character, value and management of personal paper archives , ACM Transactions on Computer Human Interaction, vol. 8, n2, 2001, p. 150-170.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 222/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Partie 6 - Documents numriques : problmatiques de disponibilit et d'accs

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 223/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

La revitalisation numrique du patrimoine littraire territorialis


Jean CASENAVE Laboratoire IKER UMR 5478, CNRS Bordeaux 3 UPPA Christophe MARQUESUZA Laboratoire LIUPPA - quipe daccueil n3000 - IUT de Bayonne Pays Basque Pantxika DAGORRET Laboratoire LIUPPA - quipe daccueil n3000 - IUT de Bayonne Pays Basque Gaio MAURO Laboratoire LIUPPA quipe daccueil n3000 - UFR Sciences et techniques - Pau Dans tous les pays de lEurope de louest, les institutions nationales 198 prennent des initiatives pour mettre leur patrimoine culturel dintrt national ou universel en valeur par le biais des technologies numriques et du web. En France, le Muse du Louvre, la Bibliothque nationale de France et son serveur lectronique Gallica, lInstitut National de lAudiovisuel et lensemble des grands tablissements offrent des services varis qui vont de la visite virtuelle la mise en ligne de contenus tlchargeables ou consultables, en passant par une gamme tendue dactivits adaptes aux divers publics potentiels. En revanche, la valorisation des fonds de notorit moindre est beaucoup plus ardue, quil sagisse de corpus relevant de registres exigeants ou plus circonscrits en termes de rayonnement gographique. Pour sen tenir lexemple franais, on peut toutefois citer quelques tentatives intressantes, limage de celles que proposent la bibliothque lectronique municipale de Lisieux (http://bmlisieux.com) et le service des Archives de la Rgion Savoie sur son serveur lectronique Saubadia (http://www.sabaudia.org). Cependant, le domaine demande tre dvelopp car le patrimoine dont disposent ces espaces territoriaux est aussi riche que vari, et son potentiel de valorisation tout fait incontestable.
198.

Bibliothque nationale de France : <http://gallica.bnf.fr> - Archives littraires suisses : <http://www.nb.admin.ch> Bibliothque nationale du Luxembourg, Centre national de littrature : <http://literaturarchiv.lu/fr/> - Bibliothque royale de Belgique : <http://www.aml.cfwb.be> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 224/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Cest pourquoi, dans le cadre de ce colloque consacr au cycle de vie du document, nous proposons une rflexion sur la mise en valeur des fonds territorialiss locaux, rgionaux et tout particulirement des ensembles documentaires constitus autour des corpus littraires anciens. Nous tudierons les conditions de revitalisation culturelle et technique dun corpus littraire oubli . Nous nous efforcerons de montrer que, dans ce nouveau march des biens culturels ouvert la concurrence, il y a bien une place pour lexpression des singularits rgionales ds lors quil existe un projet de socialisation conu au plus prs des ressources numrises, dans un esprit de coopration entre les instances en charge du dveloppement des territoires et les quipes de recherche spcialises dans les contenus et les technologies de la communication. Nous traiterons dabord de lintrt patrimonial de ces fonds documentaires, pour aborder ensuite la liaison entre la conversion numrique des fonds, la problmatique de leur diffusion et celle des dispositifs techniques et conceptuels qui prsident leur communication. Par leur ancrage dans les lieux quils voquent, ils livrent dindispensables lments de connaissance objective mais aussi de prcieuses reprsentations dordre subjectif. Indubitablement, ils contribuent enrichir ce nouvel imaginaire des territoires que les nouveaux rcits pdagogiques, mdiatiques ou touristiques sefforcent de reconstituer, bien trop souvent dans lignorance des sources bibliographiques disponibles. lheure de llargissement de lEurope, ce repositionnement de larchive territorialise au sein du discours culturel, reprsente un enjeu important. Par leur conversion au format lectronique, ces ressources deviennent lobjet dun partage largi de linformation et des savoirs qui va bien au-del des communauts scientifiques et ducatives. Leur socialisation touche lespace public ds lors quelle entre dans le champ du dveloppement conomique rgional par le biais des activits touristiques ou par son ouverture au grand public. Ce sont donc l autant de nouveaux usages ladresse de nouveaux publics, et les technologies de linformatique et des multimdias permettent dassurer ce polymorphisme au document trait. Pour clairer ce point technique dans la deuxime partie de notre expos, nous aborderons la question de la prparation conceptuelle et technique de ces documents. Quil sagisse de littrature populaire, savante ou encore de reprsentations iconographiques, lomniprsence des lieux caractrise le fonds local ou territorialis et les documents fourmillent de notations et de repres spatiaux (onomastique, squences descriptives, etc.). Compte tenu de la spcificit de larchive territorialise, nous avons choisi dexprimenter une didactisation partir de la smiotique du territoire. Pour tre vritablement opratoire, la prparation informatique du document (pose de balises ; appareillage conceptuel, technique et ergonomique) doit soprer ds la numrisation. En fonction de paramtres tels que le genre du document-source ou celui des publics cibls, la prparation de lapplication numrique devrait pouvoir se faire selon des

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 225/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

protocoles reproductibles et extensibles un large ventail de ressources relevant des corpus territorialiss. Lquipe de recherche interdisciplinaire199 que nous avons constitue pour mener bien cette tude de la didactisation des corpus territorialiss (textes littraires, ressources iconographiques et phonographiques) se compose de chercheurs spcialiss dans les domaines de la langue et de la littrature, de linformatique et du multimdia, et elle pourrait prochainement recevoir lappui de spcialistes de lamnagement du territoire et de la gestion de projet.

Conditions de resocialisation dun corpus restreint

La question des corpus restreints


Une problmatique spcifique, des contraintes conomiques

Compte tenu des cots levs que reprsente le traitement informatique des fonds papier , les corpus restreints ou dintrt moindre au plan du rayonnement gographique, linguistique, littraire ou culturel, ne peuvent pas bnficier des mmes possibilits de numrisation que les uvres perues comme majeures : ils ne possdent pas la mme lgitimit culturelle auprs du public ni la mme reconnaissance institutionnelle. La transposition lectronique de louvrage dun auteur considr comme secondaire ou celui dun romancier en voie de conscration sera difficile justifier auprs dun grand tablissement de diffusion. Il en est de mme pour des genres moins priss aujourdhui comme la posie ( lexception des valeurs sres) ou encore la production potique, thtrale ou journalistique de certains crivains consacrs des
XVIII
e

et

XIX

sicles. En effet, ce sont toujours les mmes titres (romans, essais,

recueils de pomes, darticles ou pices de thtre en fonction de limage que notre poque se construit de cet auteur) qui profiteront des possibilits de publication et, par voie de consquence, auront quelque chance daccder la numrisation. ces cas particuliers, il faut ajouter dautres corpus restreints qui sont crits dans des langues rares et peu rpandues ou qui prsentent une
199.

Cette quipe est constitue par des chercheurs appartenant aux laboratoires indiqus ci-dessous : IKER est une Unit mixte de recherche (5478) qui regroupe des membres du CNRS et des enseignants chercheurs de luniversit de Bordeaux 3 et de luniversit de Pau et des Pays de lAdour. Centre de recherche sur la langue et les textes basques, ce laboratoire travaille sur le domaine basque partir de directions de recherche varies. LIUPPA est le laboratoire dinformatique de luniversit de Pau et Pays de lAdour, quipe dAccueil n3000. Les auteurs de cet article appartiennent lquipe IDEE (Interaction, Document lectronique et ducation). Au cours de lanne 2003, ces deux quipes ont dcid de sassocier autour dun thme de recherche commun : la valorisation du patrimoine local dans la culture numrique. Ltude propose loccasion de ce colloque a t mene dans le cadre de ces activits communes.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 226/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

spcificit gographique. titre dexemple, nous dvelopperons ici la problmatique qui est attache aux fonds locaux et territorialiss.
Un exemple de corpus restreint : le corpus local ou territorialis

Toute bibliothque, en ville comme dans les bourgs ruraux, rserve une partie de sa surface dexposition aux livres qui voquent la ville, la rgion, le terroir, bref, un territoire plus ou moins bien identifi, sujet de prdilection dun ensemble de publications que les spcialistes saccordent dsigner par lexpression fonds local . Nous lappellerons plutt territorialis pour viter le caractre restrictif et parfois condescendant qui est attach au terme local par opposition national ou universel . Le qualificatif territorialis indique aussi que ce corpus sinscrit explicitement dans cet espace dtermin, il sen inspire et sen imprgne, il en explore les dimensions physiques et oniriques, dploie son imaginaire et le met en scne avec bien souvent un luxe de dtails qui fait la spcificit de ce type de document. Aux ouvrages prsents au public, il faut gnralement ajouter le nombre considrable des livres qui figurent dans les rserves et qui, napparaissant que sous la forme dune mention dans le catalogue de ltablissement, ont bien peu de chances dattirer lattention du lecteur ordinaire. Au ct douvrages trs divers (histoire locale, gographie locale, conomie, traditions, beaux livres essentiellement photographiques, etc.), la littrature (contes et littrature populaire crite et orale, rcits de voyages, romans ruraux et rgionalistes, iconographie du territoire) occupe une place de choix. Priss par un public toujours renouvel (bien que relativement restreint), de curieux, drudits, duniversitaires ou dtudiants, les ouvrages littraires qui garnissent ces rayons rgionalistes ou territorialiss ont a priori peu de chances daccder au nombre des rditions. Comme nous le verrons plus loin, ces divers points lui confrent un caractre exemplaire et constituent un bon potentiel de revitalisation .
Un champ dexprimentation interdisciplinaire

Cette rflexion laquelle nous avons souhait donner le caractre le plus gnral possible sappuie sur une exprience interdisciplinaire bien prcise. En effet, la collaboration entre les deux laboratoires cits plus haut (IKER-LIUPPA) sest concrtise loccasion dun appel projets lanc par les institutions locales (dpartement, rgion) auquel nous avons rpondu en proposant le thme de la valorisation numrique du patrimoine local. Nous avons engag des recherches dans diverses directions, et celle de la resocialisation numrique des fonds bibliographiques, iconographiques et phonographiques du domaine basque relatif la premire moiti du
XX
e

sicle

nous est apparue la fois riche au plan documentaire, et trs prometteuse en termes dinterdisciplinarit. Cela nous a conduits dans un premier temps dfinir les bases dun traitement

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 227/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

interdisciplinaire des documents puis, en fonction de ces critres la fois thoriques et techniques (corpus oubli , redoubl par une documentation iconographique et phonographique, etc.), proposer la numrisation dun corpus aux contours bien dfinis afin dtudier les possibilits de valorisation informatise quil recelait. En consquence, dans le cadre dune collaboration troite entre spcialistes des documents (textes et des contenus iconographiques et phonographiques) et informaticiens, nous avons slectionn un ensemble de textes issus de la littrature populaire du XIXe sicle (contes, proverbes, chansons) et un petit nombre de romans en langues basque et franaise 200 qui dcrivent tous abondamment le Pays basque. Ces derniers ont en commun davoir tous t publis entre 1893 et 1946 et appartiennent donc au courant littraire rgionaliste qui a connu son heure de gloire dans la premire moiti du mondiale. La remise en circulation de ces fonds documentaires reprsente un dfi technique et conomique intressant ainsi quun enjeu culturel important. Les propositions qui rsultent de cette rflexion interdisciplinaire sont autant dhypothses de travail, sans doute partages par la plupart des quipes de chercheurs qui tudient la valorisation numrique dun corpus restreint . Cest ce qui nous a amens penser que les problmatiques auxquelles nous nous sommes heurts propos de notre corpus territorialis taient, dans une large mesure, transposables la plupart des cas de figure prsents par les corpus restreints.
Les caractristiques du corpus territorialis
XX
e

sicle. Ils prsentent tous la caractristique davoir connu une certaine

notorit lpoque de leur parution mais nont pas t republis depuis la fin de la seconde guerre

Chaque corpus restreint possde la fois ses atouts et ses faiblesses. Le recensement de ces lments et leur tude interdisciplinaire sont fondamentaux dans la perspective de la valorisation numrique du corpus. Comme on le verra ci-dessous, les points forts du corpus, lancrage territorial en loccurrence, donneront prise sur les documents et constitueront laxe principal du travail interdisciplinaire.
Un fonds inscrit dans un ensemble historico-gographique

Dans la tradition littraire franaise, G. Sand pour les terres du centre de la France, J. Giono pour la Provence, E. Le Roy pour le Prigord, H. Pourrat pour lAuvergne, P. Loti pour le Pays basque et la Bretagne viennent immdiatement lesprit lorsquil sagit dassocier une uvre un territoire. Et il y a les innombrables ouvrages dauteurs oublis qui ne demeurent vivants que pour
200.

En matire de fiction, la plus grande part de la cration de lentre-deux-guerres est dexpression franaise.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 228/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

quelques dizaines de lecteurs spcialiss . Plus ou moins longuement aprs leur parution, ces livres ont connu une notorit nationale, rgionale ou seulement locale. Puis, non rdits et tombs dans loubli, ils dorment dans les rserves des bibliothques et ne trouvent un dlai de grce que chez les bouquinistes o les habitus sont souvent davantage collectionneurs que lecteurs. Cependant, ces fonds constituent des sources dinformations prcieuses de nombreux titres. Inscrits dans un ensemble historico-gographique dtermin, ils font rfrence de faon dense et prcise des lieux qui sont nomms de manire explicite : toponymes bien sr, mais aussi noms de points deau ou de rivires, noms de villages ou de villes, noms de maisons aussi, dans le domaine basque trs souvent en troite relation avec les noms personnages qui sont galement des domonymes. Ces documents abondent en descriptions particulirement prcises du territoire et des paysages mais voquent aussi les murs et des activits laborieuses comme festives. Le corpus des cartes postales, celui des images en gnral (photographiques, cinmatographiques et vidographiques), dune manire souvent redondante par rapport lcrit, est son tour venu consacrer les mmes paysages (le rivage, la montagne, la fort, la ferme, etc.), les mmes activits ludiques (la partie de pelote, la danse, la pastorale ou la foire, etc.) ou les mmes personnages (le chanteur, le berger, le bouvier, le grand-pre, etc.), jusqu en faire des reprsentations strotypes . lintrieur comme pour lextrieur, cest donc limage dun terroir aujourdhui vcu 201 comme territoire qui sest constitue autour des reprsentations proposes par ce fonds papier et par ses adjuvants. Bien que remplac par les nouveaux discours du territoire dont il sera question plus loin, on peut dj avancer lide que limaginaire local contemporain est encore largement influenc par cette source, et ceci sans le savoir et sans y faire directement rfrence, simplement en sappuyant sur les motifs strotyps qui ont perdur et qui sont invariablement repris avec peu de recul critique. un moment o la notion de territoire 202 relance lancien concept de terroir dune faon largement renouvele et ajuste nos proccupations actuelles par la gographie humaine et lanthropologie contemporaines, toutes les vocations localises retrouvent un intrt, quelles soient textuelles, iconographiques ou sonores. Cest sous cet clairage quil est possible doprer une relecture et une rvaluation de ces fonds dans le champ culturel contemporain. De plus,
201.

Cette expression fait bien sr rfrence au livre du gographe (Frmont, 1976), ouvrage pionnier en la matire mais aussi son tude sur la Normandie telle quelle apparat dans les rcits de Maupassant. 202. Dans le cadre de cet article, il nest pas possible dintgrer des dveloppements nourris de lapport effectu sur ces questions par les gographes, les historiens, les anthropologues, les ethnologues et les spcialistes des sciences de linformation et de la communication (cf. Bibliographie).

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 229/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

linformatisation des corpus documentaires renouvellent srieusement les opportunits de resocialisation et de valorisation leur endroit.
Un fonds oubli et invisible

Cependant, avant denvisager leur renaissance , il faut savoir ce quil en est, lheure actuelle, de lexistence des corpus locaux ou territorialiss des priodes cites. Pour lessentiel, ils sont devenus des documents darchives et ne connaissent plus dsormais que la frquentation dun public trs rduit et spcialis qui en fait une utilisation savante (recherche universitaire, rudition locale, source de rfrences et dictionnaire de citations souvent les mmes pour les journalistes). Oubli et remis dans les magasins des bibliothques, ce fonds souffre donc dun manque de visibilit. Il faut ajouter cela, un indniable dficit de lisibilit pour le non spcialiste. La difficult, comme pour la plupart des textes littraires ou documentaires du pass, tient bien sr lobstacle linguistique et stylistique, cest--dire un tat de langue et de style littraires dsormais trs dat. Mais elle provient galement des contenus eux-mmes car le discours tenu sur lespace local peut sembler lui aussi trs dat puisquil participe dun mouvement de singularisation outrance des terroirs bien caractristique des courants folkloristes et rgionalistes de la premire moiti du
XX
e

sicle mais difficile voire impossible comprendre pour les lecteurs

contemporains. Autant dire que la remise disposition du grand public de ce corpus ncessiterait un important travail dhistoricisation, notamment travers la mise au point dun appareil critique. Un premier pas vers la revitalisation de ce corpus consisterait le rpertorier de faon systmatique dans le catalogue lectronique des tablissements, ce qui nest pas le cas pour linstant, puisque, pour la plupart, les uvres ne figurent que dans le catalogue papier . Cela leur permettrait daccder au statut darchive littraire et les rendrait visibles et, par voie de consquence, consultables ne serait-ce que sous sa forme papier . Cependant, il est indiscutable que ces fonds possdent dautres atouts de revitalisation.
Le potentiel de revitalisation de ce fonds

Comme indiqu plus haut, ce corpus porte en lui une connaissance approfondie des lieux et du territoire quil voque. Ce point constitue le cur de son potentiel de revitalisation. Malgr son caractre dat, il continue faire sens en termes de donnes gographiques, historiques, ethnographiques et littraires par exemple. Les nouveaux rcits pdagogiques, mdiatiques ou

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 230/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

touristiques du territoire sefforcent de reconstituer ces savoirs et, sans nul doute, ils gagneraient se ressourcer dans les uvres originales pour toffer leurs descriptions et les appuyer de citations plus varies. Paradoxalement, cest mme son caractre dat qui en fait le prix. En effet, il reprsente une mmoire de ces espaces et des visions dont ils ont fait lobjet dans un pass somme toute encore rcent. Inscrits dans des reprsentations concrtes du territoire ou relevs comme les affleurements dun imaginaire et dune subjectivit plus intimistes, ces repres littraires ou culturels situs au cur des documents sont susceptibles dalimenter ce grand rcit du territoire qui se dveloppe dans la littrature contemporaine ou dans la presse spcialise (magazines consacrs des territoires spcifiques ; exemples : Alpes magazine, Pyrnes Magazine, Pays Basque Magazine, Bretagne Magazine, etc.), que dans les publications les plus varies (anthologies, albums photos, nombreuses publications lies la dcouverte de lenvironnement, etc.), dans le matriel pdagogique prpar lintention des classes par les services ducatifs spcialiss et dans les manifestations culturelles et touristiques. Bien entendu, la lisibilit du corpus doit tre assure par un appareil critique adquat. Les documents cits participent donc pleinement dune smiotique du territoire qui, comme on le verra plus avant, peut devenir le dnominateur commun pour les utilisateurs comme le concept de traitement des donnes des concepteurs de la didactisation. Les raisons a priori objectives de la remise en circulation de ce corpus paraissent donc bien tablies ; encore faut-il voir maintenant quelles conditions il est possible de rintroduire ces donnes dans le flux des savoirs et des informations qui circulent dans la socit contemporaine. Cest aussi loccasion dobserver comment elles peuvent sintgrer dans la culture numrique en cours de constitution.
La resocialisation du corpus

Si lon envisage de resocialiser un corpus restreint, il faut y trouver des entres qui conviennent aux utilisateurs actuels rels cest--dire dj actifs comme potentiels (extension du nombre et des types dutilisateurs). Il sagit donc de trouver des dnominateurs communs qui rapprochent les diverses communauts.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 231/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Numrisation et ralisme conomique

La

numrisation

reprsente

pour

ces

fonds

documentaires

(bibliographiques,

iconographiques, phonographiques) oublis, la seule opportunit densemble vritablement raliste dune resocialisation et dune revitalisation . En effet, il nest pas envisageable de faire republier un ensemble de textes dsormais difficilement lisibles . Certes, quelques maisons dditions ont tourn la difficult en publiant des morceaux choisis ou en constituant des ouvrages thmatiques ou encore en proposant des textes peu connus dauteurs clbres (Victor Hugo). Toutefois, il est impensable de mettre en place une politique ditoriale papier qui permettrait une resocialisation dun corpus tendu. En revanche, la transposition numrique peut offrir de nouvelles perspectives. En effet, la conversion au format lectronique modifie grandement les modes dutilisation traditionnels puisque sa transformation en fichier informatis scelle son polymorphisme et sa banalisation parmi bien dautres ressources possibles (iconographiques et sonores : fonds photographiques, cartographiques, cinmatographiques, etc.). Ds lors, ces documents numriss deviennent utilisables pour euxmmes avec toutes les commodits que procure le format lectronique : consultation distance, tlchargement, annotations, etc. Ils peuvent aussi faire lobjet dune valorisation en association avec les autres ressources voques plus haut, elles aussi informatises. Encore faut-il que les modalits de diffusion de ces ressources soient trouves. Cela implique la ncessit de concevoir un projet de valorisation des corpus numriss au-del du seul souci de prservation dun hritage du pass, sous la forme darchives.
Le repositionnement du corpus local dans le champ culturel

Il sagit donc de rendre les contenus de ce corpus au public, travers un usage largi et actualis dans le cadre de la culture numrique. En quelque sorte, il faut le repositionner parmi les ressources actuellement disponibles propos du territoire voqu et lui donner un statut nouveau. Ce processus de resocialisation a deux aspects complmentaires, un versant technique et un versant conceptuel et ils sont tous les deux troitement imbriqus. Le changement de statut de ce fonds est complexe. Il doit retrouver une pertinence quil a perdue au milieu des nouveaux rcits du territoire voqus. Comme indiqu plus haut, ceux-ci proviennent de milieux diffrents mais ces discours aussi bien journalistiques, politiques, conomiques, ducatifs que touristiques, sappuient tous sur la mme entit territoriale et partagent avec le discours littraire du pass la mme volont de mettre cet espace plus ou moins dfini en valeur pour asseoir leur lgitimit.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 232/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

La resocialisation passe ncessairement par deux oprations qui sont grandement facilites par la transposition des uvres en version lectronique. En effet, grce la numrisation, luvre devient visible. Par le simple fait de la faire apparatre dans un catalogue lectronique, la ressource reprend vie. Ds lors, elle peut circuler titre de rfrence. On peut aussi envisager sa mise disposition totale auprs du public puisque la numrisation a transform luvre en fichier informatique. Il est donc possible dafficher le texte, de le tlcharger, de le manipuler au sens propre du terme, de lannoter, de le fractionner pour lutiliser des fins particulires. Mieux, on peut aussi penser le transformer avant de le proposer nouveau la lecture. Bref, aprs lavoir rendu nouveau visible, le processus de numrisation peut lui rendre une existence socialise en le remettant en circulation travers les voies largement ouvertes de lInternet. Ainsi, dans le cadre de la culture numrique, la ressource territorialise produite localement qui navait quun rayonnement limit, se voit propose un public alatoire et considrablement largi, tout au moins potentiellement. Enfin, cette visibilit renouvele, cette remise en circulation dcuple par les moyens techniques contemporains, propulse ce corpus oubli au rang darchive littraire rpertorie et utilisable par le plus grand nombre. De plus, elle transforme insensiblement ce fonds darchives en patrimoine littraire territorial. Ce nouveau statut dobjet patrimonial classe ces uvres du pass au rang de monument la fois source de tmoignages dignes dintrt et de lieu (virtuel) qui mrite le dtour pour une visite. On voit sans peine que la numrisation a rendu le corpus considr sa vocation de rfrence tout en le remettant au cur des activits culturelles ; en un mot, elle la redynamis, revitalis. Toutefois, dans le mme temps, elle a modifi le rapport ces ressources, leur utilisation et, par voie de consquence, leur interprtation. On peut penser quau prix de ces transformations, ces documents ont t rendus leur public potentiel savoir, les universitaires et leurs tudiants, les rudits, les professionnels de la plume, crivains et journalistes, ceci, dans une forme actualise qui facilite grandement lutilisation des documents. Pourtant, il ne fait gure de doute que les divers changements voqus ouvrent de nouvelles perspectives aussi bien en matire dusages nouveaux que dlargissement du public susceptible de frquenter et dutiliser ce corpus.
Nouveaux publics, nouveaux usages

loccasion de nos recherches interdisciplinaires sur la numrisation du patrimoine littraire attach au domaine basque, nous avons travaill sur la question de la resocialisation du

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 233/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

corpus tant du point de vue des spcialistes des contenus que des concepteurs de lquipement numrique des applications. Tout en sachant que la mise disposition du corpus sous la forme dapplication informatique en circuit contraint et surtout sur lInternet, donne lventail des publics et des utilisations possibles un caractre alatoire et imprvisible, nous avons privilgi trois types de publics pour trois types dusages. Il sagit de la communaut scientifique et rudite 203 pour un usage savant, puis de la communaut scolaire pour un usage pdagogique et enfin, du grand public susceptible davoir un usage informativo-ludique ou informativo-documentaire du corpus, par exemple dans le cadre dune exploitation touristique des ressources numrises. Il est indniable que lusage le plus attendu correspond celui de la communaut scientifique puisque, qualifi ici de savant , il se place dans le droit fil de lutilisation traditionnelle de ce corpus territorialis, savoir, une tude approfondie du texte, de ces sources et du contexte qui la vu natre. Cette valorisation du document dbouche souvent sur la ralisation dune dition savante dote dun appareil critique qui en enrichit la lecture dfaut de toujours la faciliter. Dans la mesure o il existe au format lectronique, ce corpus pourrait aussi donner lieu une prparation pour une utilisation fragmentaire, ventuellement en association avec dautres documents disponibles dans dautres mdias. Cette prsentation peut intresser de nouveaux publics qui ne feront pas du fonds une utilisation exhaustive linstar des utilisateurs traditionnels. Ainsi, cest la perspective de toucher de nouveaux publics susceptibles dexprimenter de nouveaux usages des documents qui dcoule de la transposition numrique. Pour tre en mesure daborder la question du partage des corpus avec de nouveaux publics, il faut auparavant voquer les changements profonds que linformatisation entrane dans le rapport au texte et luvre littraires. Ds lors quil est numris, le texte littraire peut ventuellement tre intgr dans une base de donnes extrieure son environnement habituel et, ds lors, se pose la question de llargissement des publics susceptibles de sintresser lui. En effet, il ne sagit pas simplement de vouloir numriser des corpus parce que la possibilit technique existe. Il faut aussi savoir pourquoi et pour qui le faire. Il faut donc avoir un projet pour ce patrimoine, un projet de transmission, de partage. Il faut alors rflchir aux conditions de cette ouverture, de ce partage.

203.

Lexpression communaut rudite recouvre ici le nombre des lecteurs spcialiss qui sont habituellement qualifis drudits locaux .

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 234/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Pour se limiter au patrimoine littraire territorialis et sans chercher le moins du monde lexhaustivit, nous nous contenterons dillustrer cet largissement des publics et des usages travers deux exemples situs aux deux extrmes du spectre des activits rendues possibles par linformatisation des ressources : la communaut ducative et les professionnels du tourisme. Le texte peut fort bien tre reu de faon autonome comme celui de toute uvre littraire mais son ancrage territorial peut galement lui permettre de constituer un prcieux apport dinformations dans dautres modalits de lecture. Quils servent de repres, de descripteurs explicites ou mme de caution culturelle sous forme de citations ou dallusions dans un article de revue, voire dans une brochure touristique, ces lments prennent tout naturellement place au rang de rfrences indispensables et parlantes. Ils peuvent aussi de faon moins parcellaire tre inclus dans la documentation pdagogique dune classe-patrimoine, par exemple parmi des ressources de types et dorigines trs divers : collections photographiques, cinmatographiques, vidographiques, phonographiques, etc. En effet, ces repres linguistiques et littraires doivent sintgrer parmi dautres sources de connaissance du territoire, quil sagisse des donnes lies la nature (gologie, hydrologie, flore, faune, etc.), ou des tudes scientifiques au sujet des activits humaines traditionnelles ou contemporaines. Depuis quelques annes, de nouveaux lieux rels ou virtuels sont amnags pour exposer ou utiliser les matriaux et les objets qui permettent daccder la connaissance des territoires et ils sont souvent mis en uvre par les institutions locales (dpartement, rgion) : muses, centres culturels, services pdagogiques des muses, classes-patrimoines, etc. ces lieux bien rels qui utilisent les technologies numriques dans leurs activits, il faut joindre par exemple, les expositions itinrantes ou permanentes qui sous la forme de bornes interactives, mettent la culture locale la disposition du grand public. cela, il faudrait encore ajouter les visites virtuelles des muses, les bornes consultables dans les offices de tourisme ou les sites web et autres portails de la culture qui intgrent le domaine territorialis et qui touchent aussi bien le grand public local que celui du tourisme. travers lvocation de cet largissement des publics susceptibles de sintresser aux fonds locaux, il apparat clairement que les mentalits vont devoir voluer de faon notable. Les littraires et autres spcialistes des contenus ne vont plus pouvoir se tenir fermement sur leurs principes quant lintgrit du texte littraire ou de luvre dart. Les mthodes de travail des informaticiens et des experts en communication vont ncessairement bousculer les habitudes de leurs homologues linguistes ou gographes, et inversement. Pour tre en mesure de proposer la valorisation numrique

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 235/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

dun corpus, il faut lui appliquer un traitement que de nombreux littraires jugeront contre-nature, savoir une analyse des besoins des publics, une tude de leur horizon dattente, exigences et attentes plus diffuses confondues, un bilan de leurs comptences techniques et culturelles. Cette analyse des besoins vise donc dterminer pour qui et selon quel usage luvre littraire peut avoir du sens. Elle permet galement de savoir comment il faut lapprter pour que ces nouveaux publics puissent utiliser les ressources selon leurs attentes ou pour faire natre de nouvelles ides dutilisation.
Les conditions de revitalisation numrique du corpus

La recherche dans ce domaine ne se pose donc pas seulement en termes de technique informatique ou de connaissances linguistiques ou littraires. Elle implique aussi toute une rflexion sur la possibilit de mettre disposition de nombreux utilisateurs aux objectifs et aux pratiques diffrents un mme document de base, en loccurrence un corpus littraire et son iconographie annexe. Un tel travail dquipement des corpus doit se faire en partenariat troit entre les divers secteurs concerns : conservateurs et responsables techniques des tablissements dtenteurs des fonds, spcialistes des contenus linguistiques et littraires, informaticiens et professionnels du multimdia. Il comprendra ncessairement une phase dquipement technique de la documentation essentiellement consacre au marquage smantique du corpus ainsi quune phase dappareillage conceptuel plus particulirement tourne vers les interactions et la conception de scnarios dutilisation. Cependant, compte tenu de la spcificit du fonds voqu, il faut dabord sarrter sur la grille de lecture et dinterprtation du corpus qui sert de dnominateur commun aux divers prparateurs chargs de travailler la prparation des archives en vue des usages traditionnels comme nouveaux.
La smiotique du territoire comme entre polyvalente dans le corpus

Aujourdhui, lopration qui consiste quiper un tel corpus associe spcialistes des contenus et de linformatique. Elle se concentre essentiellement sur la mise au point dappareil de notes, de renvois par des liens ancrs dans le texte vers des documents placs en annexes ou vers dautres sites ; bref, cest ldition critique hypertextuelle 204 destine une diffusion et un usage savants qui constitue le principal horizon de ces nouvelles techniques appliques au texte littraire. Au cours des prochaines annes, compte tenu de llargissement des publics et des utilisations mais aussi du potentiel dvolution technique que possde loutil informatique, il sera indispensable de rflchir des formes de didactisation des documents beaucoup plus varies.

204.

Exemples : (Goulet, 2000), projets IRMA et Flaubert (cf. Bibliographie).

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 236/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

La prparation informatique du texte (pose de balises, outillage technique conceptuel et ergonomique etc.) ds sa numrisation par lapplication de protocoles dfinis en fonction du genre des documents, devra, pour des raisons de diffusion, prendre en compte lventail le plus large possible des publics susceptibles de les utiliser. La didactisation de luvre littraire ou du document culturel ira donc de pair avec la mise au point dune scnarisation des donnes comme des utilisations possibles. Dans le cas de notre corpus, cest lobjet territoire qui constitue la fois le contenu sur lequel il sagit de travailler et la forme qui va tout la fois contraindre et faciliter la didactisation des documents. Le territoire est un objet culturel dot de sens documents dans des contextes sociohistoriques donns. Il est constitu dun grand nombre dinformations qui vont des plus lmentaires, comme les repres gographiques, aux plus complexes qui pourraient tre par exemple les reprsentations successives de ce territoire, classes selon leur apparition chronologique. Mais, le territoire est aussi un objet interactionnel dans la mesure o sa signification est toujours le rsultat dchanges entre divers interlocuteurs ; en somme, il est un interdiscours permanent, toujours en construction, toujours en volution, toujours en ngociation. Dans le cas dune exploitation numrique du corpus, ces dimensions donnent toutes deux prise la didactisation, cest--dire la prparation de la documentation et de sa transmission des publics cibls. Le territoire objet culturel donnera lieu une opration de marquage (cf. Prise en compte de la smiotique du territoire par un reprage automatique ) alors que le territoire en tant quobjet interactionnel sera la matire de scnarios dinteractions entre lapplication informatique et les usagers (cf. Revitalisation du corpus territorialis par la mise disposition doutils ).

Lappareillage technique du corpus

o Marquage et lments dinterprtation Cependant, spcialistes des contenus et informaticiens se rejoindront sur une porte dentre commune dans le corpus et la mme grille de lecture et dinterprtation des documents. Cette dernire est fournie par la smiotique du territoire ou plutt par certains lments emprunts ce systme smiotique, savoir les noms de lieux (toponymes, hydronymes, domonymes, etc.) rfrencs et documents ainsi que les marques spatiales internes au rcit et en relation avec le systme nonciatif.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 237/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

La smiotique du territoire constitue donc le mode de lecture et dinterprtation commun des documents. En mettant laccent sur les repres spatio-temporels, elle permet llaboration dindex smantiques qui sont autant de points dentre ou daccroche pour les diffrents concepteurs et prparateurs de la version informatise du corpus. Ces repres reprsentent la fois la richesse documentaire du corpus considr et une partie essentielle de son potentiel de dynamisation. Sur le corpus considr, nous avons donc appliqu une grille de balisage relativement fine et assez largement polyvalente puisquelle devrait pouvoir rpondre aux besoins de plusieurs types dutilisateurs pour des usages varis, depuis la modalit informative jusqu la recherche dordre linguistique. Ainsi, la conception du territoire comme contenu sociohistorique constitu ou objet culturel a tout naturellement trouv un prolongement didactique dans la dmarche dinformatisation. Toutefois, si lon considre que le territoire est un objet culturel complexe, il est bien vident que la documentation relative aux noms de lieux constitue une dimension minimale voire minimaliste de lensemble des donnes que cet objet culturel comprend. Cependant, comme nous le verrons plus avant, ces repres territoriaux font signe dans le texte comme sur les autres types de documents utilisables (cartes gographiques, cartes postales, photographies, et autres documents iconographiques, etc.) ou sur le terrain pour lensemble des prparateurs-concepteurs de lappareillage des documents comme pour tous les utilisateurs potentiels.

o Les interactions et les divers scnarios dutilisation des ressources Associ au linguiste ou au gographe, dans un premier temps, linformaticien tirera de ces lments territoriaux un index qui rpertoriera les segments linguistiques simples comme complexes lis lexpression du lieu. Il les classera en fonction des prcisions qui lui seront fournies. Dans un deuxime temps, cette base de donnes sera susceptible de permettre toutes sortes doprations de manipulation et dappropriation des documents par des utilisateurs experts comme plus occasionnels. Le linguiste, le littraire et la communaut scientifique dans son ensemble y verront la possibilit den faire un usage savant et exhaustif. Lenseignant en proposera un usage pdagogique lintention de ses lves. Quant aux professionnels de linformation, de lconomie locale ou du tourisme, ils en feront un usage partiel et parfois inattendu parce que dtourn ou indit pour apprter un service un public restreint (restaurateurs, hteliers, touristes, etc.) ou en direction du grand public (offices de tourisme, sites web des grandes villes ou des institutions rgionales).

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 238/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Ainsi, compte tenu de louverture potentielle de nouveaux publics pour de nouveaux usages, le corpus doit tre prpar ou didactis de manire le rendre prhensible aux plans conceptuels comme ergonomiques dans le cadre de pratiques tendues et renouveles qui restent aujourdhui, pour lessentiel, crer tant sur le plan conceptuel que technique. Si dans la phase de didactisation et dappareillage des documents, les points de rencontre entre les spcialistes des contenus et leurs homologues informaticiens taient avant tout les toponymes et autres repres spatiaux, dautres concepts deviennent progressivement des entres particulirement fructueuses ds lors quil sagit daborder les usages. Ainsi, lapproche du concept de territoire comme interdiscours ou objet interactionnel ouvre des perspectives intressantes en termes de scnarisation du corpus notamment quant la mise au point de scnarios dutilisation des ressources. Il est toutefois certain quen associant troitement la connaissance du domaine local et les concepts de la smiotique du territoire par lintermdiaire des multiples moyens de reprage et daccs linformation que fournissent les technologies de linformatique et des multimdias, ces nouveaux usages peuvent notablement modifier la relation aux corpus littraires et culturels. Ils peuvent aussi susciter de nouvelles interprtations de leurs contenus travers de nouvelles approches mthodologiques et un renouvellement des besoins documentaires.
Contribution de linformatique la resocialisation dun corpus restreint

Dans cette partie, nous nous intressons au point de vue informatique et technologique de la problmatique pose, savoir, si les questionnements poss ont dj trouv, et dans quelle mesure, une faisabilit technologique. Notre tude dmarre cependant une fois la premire tape de numrisation et de reconnaissance (type Reconnaissance Optique de Caractres pour du texte) termine. Cette tape a pour effet de transposer le corpus littraire sur support papier en un corpus numrique, cest--dire un ensemble de documents numriss dots dune structure logique (paragraphes, titres) et dune structure physique (casse, police de caractres). Sagissant dun corpus littraire, notons que cette transposition entrane galement pour lui, la perte de son statut unique duvre littraire au profit dun double statut uvre-document, avec ses consquences en termes de point de vue danalyse. Ainsi, par exemple, la notion danalyse rhtorique de luvre initiale se voit transpose en analyse de la structure logique du document rsultant. Par ailleurs, le caractre restreint du corpus auquel nous nous intressons na pas dincidence particulire sur le processus de

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 239/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

numrisation, si ce nest la possibilit de recours une assistance manuelle de la phase de reconnaissance en cas de difficult. partir dun fonds numris, nous nous intressons alors dune part, la prparation conceptuelle et technique des documents en vue dune meilleure prise en compte de la smiotique du territoire, et, dautre part, leurs modalits de revitalisation par le renouvellement de leurs usages destination des diffrents publics concerns par la territorialit. Cette dmarche dingnierie sappuie ncessairement sur le travail dune quipe interdisciplinaire o sont reprsentes les proccupations et comptences des prescripteurs, bnficiaires et metteurs en scne/prparateurs du corpus littraire territorialis, savoir des spcialistes en langue et littrature, en amnagement du territoire et en informatique. Ce travail dingnierie se focalise sur deux aspects. Dune part, une ingnierie du document, dont lobjectif est lidentification et la mise en valeur, au sein des documents, de marques de la smiotique du territoire constituant une source dintrt pour les publics cibls. Dautre part, une ingnierie des interactions, dont lobjectif est la formalisation des usages que les diffrents publics cibls peuvent avoir des documents et la mise en uvre des nouvelles formes dexploitation qui en dcoulent. Ces deux aspects sont duels et complmentaires. En effet, et de manire analogue au domaine littraire, et conformment (Pdauque, 2003), le document est trait comme un objet culturel que lon analyse sur le plan de sa logique interne, mais aussi comme un objet interactionnel que lon reconstruit chaque nouvelle utilisation selon des logiques externes lies sa socialisation. Dun point de vue technique, une premire problmatique soriente donc vers le marquage (cest--dire le reprage et linterprtation cible) automatique ou semi-automatique de segments dinformations, en particulier spatio-temporels, au sein de documents textuels ou cartographiques relevant dun corpus littraire territorialis. Les documents numriss deviennent alors des ressources smantiquement marques, interrogeables et combinables grce aux outils dexploitation qui les accompagnent et qui sont bass sur les balises prcdemment poses. Notons que les spcificits dun corpus littraire territorialis constituent un atout dans la mise en uvre du reprage. En effet, dune part, lautomatisation complte du processus peut tre facilite par le caractre spcifique et circonscrit des contenus analyss. Dautre part, lorsque lautomatisation nest pas possible, cest le caractre restreint de ce corpus qui permettra de mener terme un marquage semi-automatique. Par ailleurs, le degr dautomatisation de ce processus varie selon le type de public auquel celui-ci est destin. Ainsi, par exemple, un marquage destin un public de

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 240/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

spcialistes savants fera davantage appel une supervision humaine en raison de la quantit et de la varit de marques quil doit produire. De mme, les marques juges dintrt pour un public non spcialiste seront moins nombreuses et sans doute plus faciles identifier de manire automatise. La deuxime problmatique soriente vers llaboration doutils permettant lexploitation, par les diffrents publics cibls (savants, touristes, scolaires), des ressources smantiquement marques. Il est certain que ces outils doivent tre adapts aux objectifs dutilisation, attentes et degrs de comptence de chaque public sur le domaine trait. Cela suppose une analyse pralable des publics cibls et une formalisation des usages attendus. Ainsi, pour les spcialistes du domaine, les fonctionnalits dveloppes permettront la recherche, lindexation, lannotation, lhyperisation et/ou la recomposition de nouveaux documents partir de plusieurs sources analyses. Pour les publics scolaires ou touristes, il sagira plutt de scnarios prvus par les prescripteurs et permettant le parcours, lexploration, voire lannotation des ressources lintrieur dun contexte dinterprtation familier facilitant leur lecture et leur appropriation. Les scnarios aident formaliser les contenus des documents, mais aussi les contextes dutilisation (usages) de ces documents ainsi que les modalits dinteraction avec les publics. titre dexemple, un premier travail dexploration permettant la validation de nos propositions a t ralis sur un corpus textuel et cartographique issu de la littrature populaire du domaine basque, et tout particulirement de deux textes (Cerquand, 1872), (Barbier, 1931). Pour conclure cette partie, nous voquons les limites de notre proposition et les perspectives.
Prise en compte de la smiotique du territoire par un reprage automatique de marques

La dmarche de modlisation opratoire ncessaire au traitement automatique ou semiautomatique du contenu du type de corpus littraire auquel nous nous intressons part des caractristiques spcifiques de celui-ci. En effet, en tant que fonds territorialis, il est constitu de segments , porteurs dinformation sur le territoire et ancrs sur une localisation spatiale et temporelle. De plus, ce corpus est presque toujours composite, associant des composantes textuelles, iconographiques (en particulier des cartes), phonographiques, voire multimdias. Diffrentes techniques et divers outils permettent lidentification de ces diffrents types de marques ; les rsultats les plus avancs sinscrivant dans le marquage des composantes textuelles et cartographiques que nous prsentons ci-aprs, tandis que les autres types de marques seront abords dans les perspectives dvolution de notre travail.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 241/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Illustration des objectifs fixs travers un exemple

Le texte suivant est un extrait dune lgende dcrite dans les recherches de Cerquand (1872), et sert de support un article publi dans Pays Basque Magazine, un magazine touristique et culturel destin faire dcouvrir ou mieux connatre le Pays basque au grand public (Laxalt, 2003).
la lisire du bois de Zouhoure, un pturage est sur le versant de la montagne Azaleguy, et au milieu du versant, un antre dominant un abme. Autrefois les pasteurs dalentour perdaient leur btail et nen trouvaient trace nulle part. Un jour un effroyable serpent (Herensuge) sortit de lantre pour aller boire. On vit sa tte leau du ruisseau, et la queue encore prs de lantre. Il attirait les brebis par sa seule aspiration et les engloutissait. Que fallait-il donc faire ? Source : J.-F. Cerquand, Contes parus dans Le Bulletin des sciences, lettres et arts de Pau, 1875-1876.

titre dillustration, nous avons identifi manuellement les lments suivants :


en gras les noms de lieux, de maison, de personne ou de personnage ancrs dans un territoire rel ; en italique les rfrences spatiales ancres dans le droulement interne du document ; en soulign, les lments connotation temporelle.

travers une reprsentation cartographique que lon pourrait emprunter lIGN ou composer partir dun autre type de fond de carte, il serait possible de proposer au lecteur-touriste un parcours initiatique permettant de dcouvrir la rgion dans laquelle se situe le conte. Ceci pourrait aussi tre complt par des images et chants circonstancis. Il sagit donc de proposer des techniques et outils informatiques permettant deffectuer tout ou partie de ce marquage et dassister lexpert dans cette tche. Bien que les lments identifis dans lexemple soient tous de mme nature spatio-temporelle, nous verrons que les outils et techniques permettant leur identification automatique ne sont pas de mme niveau de complexit. En effet, un premier ensemble doutils permet de reprer automatiquement les termes en gras reprsentant des toponymes et domonymes, tels que Zouhoure ou Azaleguy . Ce reprage serait facilit par exemple par lutilisation dun atlas gographique et linguistique (Videgain, paratre). Le processus de traitement ncessite aussi un autre ensemble doutils permettant alors didentifier, par extension, des termes ou expressions tels que du bois , la lisire ou de la montagne , ou encore dinterprter des segments plus complexes tels que la lisire du bois de Zouhoure .

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 242/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Dautres types de traitements pourraient galement complter cette analyse en identifiant de nouvelles balises telles que :
des images relatives aux lieux dcrits dans les textes, dont on pourrait extraire des lments significatifs ; un ensemble diconographies relatives la priode des documents textuels (si des lments dpoque sont significatifs) ; des objets sonores ou vidos.

Analyse spatio-temporelle textuelle

o Principes Un premier traitement sur le texte permet le reprage des termes candidats grce une analyse typographique (ici, tous les mots qui commencent par une majuscule) et morphologique (ici, tous les noms, car un nom se dfinit comme un mot ou un groupe de mots qui nomme une personne, un lieu, une chose ou un concept). Puis, les termes ainsi marqus peuvent alors tre soumis comme requte un service permettant de le situer par exemple dans un dcoupage administratif. Ce service peut tre un site web, par exemple comme celui du Quid <http://www.quid.fr>, qui, interrog avec lexemple du paragraphe prcdent, nous a rpondu en associant Zouhoure la commune dAlayAlabhty-Sunharette. Dans un troisime temps, cette nouvelle information nous permet de questionner un autre service permettant une localisation gorfrence directe ou par le biais du dcoupage administratif englobant. Pour notre exemple, nous avons utilis le service disponible sur le site du Conseil Gnral des Pyrnes Atlantiques <http://www.cg64.fr/fr/atlas_departement.asp>, et avons mis la requte partir du nom de la commune Alay . Ce traitement nous permet dj de construire une interprtation et dadopter lhypothse que lentit nomme est une entit connotation spatiale. Enfin, il sagit dappliquer une analyse morpho-syntaxique sur lensemble des termes environnant lentit marque et rfrence spatialement. Ce traitement, limit une certaine profondeur (la phrase contenant lentit nomme), permet de marquer les diffrents mots qui sont ventuellement associs cette entit. Les nouveaux termes reprs vont permettre de raliser une interprtation spatiale plus fine de lentit nomme. Dans lexemple, deux nouveaux noms, bois et lisire sont ainsi marqus. ce niveau, pour une interprtation plus fine du syntagme nominal, la lisire du bois de Zouhoure , les diffrentes ressources ncessaires sont de diffrents types : il peut sagir de lexiques tels que des dictionnaires des synonymes <http://elsap1.unicaen.fr/dicosyn.html>, ou encore

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 243/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

dontologies modlisant les principaux concepts de positionnement statique ( au bord , dans , entre , etc.) ou dorientation ( Nord , Sud , devant , droite de , etc.). Lanalyseur temporel fonctionne selon les mmes principes. Les points darrt sont alors des dates, des oprateurs dfinissant des intervalles ( de X Y , entre X et Y , les annes X ) et ils sont soumis une nouvelle classe doprateurs, tels que ( le dbut de X , aux alentours de X , etc.). Les diffrents principes exposs montrent que la dmarche adopte permet, dune part, de rgler le niveau dautomatisation du processus et, dautre part, de graduer la finesse des rsultats attendus. Nous allons ci-aprs prsenter les outils techniques sous-jacents permettant de mettre en uvre les principes voqus.

o Outils Les travaux que nous citons sont consacrs laide lanalyse de documents territorialiss, notamment dans leurs composantes textuelles et cartographiques. Ces outils danalyse calculent des reprsentations smantiques qui seront ensuite exploitables dans les procdures de recherche de segments documentaires. Le cur de la mthode consiste :
reprer et analyser, dans les composantes textuelles et/ou cartographiques, des segments porteurs dinformation territorialise (cest--dire spatiale et temporelle) ; donner ces segments des reprsentations symboliques indpendants du mode dexpression ; associer ces reprsentations symboliques aux occurrences des segments reprs lintrieur du document.

Cette mthode aboutit une indexation intra-textuelle, ou plus gnralement intradocumentaire, du document analys. Nous proposons dutiliser un marquage XML ( eXtended Markup Language ) des diffrents termes identifis. Ceux-ci seront aussi mis en relations et exploitables par un explorateur XML, cest--dire indpendamment de la prsentation des contenus. Ainsi, une entit nomme connotation spatiale ou temporelle sera interprte aprs reprage dans le texte ou dans une carte selon trois diffrents points de vue :
granularit (niveau de prcision : rgion, commune, bois, etc.) ; position (lisire, dans, entre, etc.) ; orientation (sud, nord, devant, etc.).

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 244/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Ces lments sont formaliss sous la forme dattribut/valeur, ce qui permet galement de construire la reprsentation smantique de lentit en XML (Gaio, 2001). De plus, notre approche du traitement de linformation territorialise combine des procds automatiss et semi-automatiss, tant pour lanalyse de composantes textuelles que cartographiques. Elle utilise la technique des grammaires smantiques locales, implmentable dans Intex <http://intex.univ-fcomte.fr/>, et parfaitement adapte ici puisquil sagit danalyser des syntagmes nominaux ou prpositionnels contigus. Grce au modle de marquage XML adopt, lensemble des outils ncessaires la mise en uvre de la dmarche est intgrable dans la plate-forme LinguaStream <http://www.linguastream.org/>, dveloppe pour rpondre une problmatique trs proche sur le plan de lanalyse textuelle. Ceci permet donc un gain de temps considrable dans limplmentation dun prototype du systme de marquage smantique. Nous disposons ainsi dune chane de traitements combinant les diffrents analyseurs relatifs aux diffrents aspects noncs dans la section prcdente (cf. Illustration des objectifs fixs travers un exemple ). Conformment aux besoins exprims, le systme permet de grer un nombre quelconque de couches de balisage , qui se superposent la structure logique du document.
Analyse des composantes cartographiques

Les lments non textuels dun corpus territorialis sont multiples : documents cartographiques, iconographiques (structurs ou non), sonores, vidos, composites, etc. Or, leur tude et utilisation en extraction dinformation posent un certain nombre de problmes en raison du caractre spcifique de chaque mdium (cartes, dessins, extraites sonores, extraits vidos). Divers travaux de recherche existent dans le domaine de lanalyse de contenus non textuels, avec des degrs daboutissement variables. Parmi eux, les travaux effectus dans le domaine cartographique mritent dtre prciss en raison des rsultats obtenus. Il est toutefois intressant de noter que, lorsque cela est possible, tous les travaux sappuient sur les mthodologies stables et prouves du domaine textuel. Les documents cartographiques constituent un mdia largement employ pour communiquer de linformation spatialise. Dans le cadre dun traitement automatique du contenu, le problme est de dfinir un modle opratoire pour ce mode dexpression afin de pouvoir laborer des traitements quivalents ceux disponibles pour le texte. Nombreux travaux (Carrire, 2000 ; Pratt, 1993 ; Head, 1984 ; Bertin, 1973) permettent de considrer lexpression cartographique comme un mode dexpression part entire au mme titre que la langue naturelle. Ceci nous conduit regarder la

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 245/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

carte du point de vue de la smiotique. En effet, lexpression cartographique peut tre vue comme un systme de communication qui consiste utiliser des signes dans un systme de signification : la carte. De manire plus prcise, un signe est constitu de deux composants : sa facette physique, qui dpend de la forme de communication (ici une marque sur un papier ou sur un cran) et habituellement appele lexpression du signe, et sa facette conceptuelle, qui rfre une signification que nous pouvons appeler son contenu. La carte, systme de signification, doit tre lie un code commun et connu par lensemble des acteurs impliqus dans le processus de communication. Cela nous amne donc la dlicate question de la smantique des cartes, objet de plusieurs travaux dans le domaine de la cognition, comme attest par T. Barkowsky et C. Freska (Barkowsky et Freska, 1997). J. Bertin (op. cit) a montr que la smantique dune carte merge ncessairement de lexplicitation des signes utiliss ainsi que de leur structuration syntaxique. Mais, tant donn que les deux composantes du terme smiotique signe sont, dun ct, les entits cartographiques places sur la carte et, de lautre ct, la connaissance gographique que nous leur faisons correspondre, cette syntaxe est en partie dpendante de la tche de lecture considre. Autrement dit, lors de la conception dun traitement automatique du contenu des cartes, il faut a priori tre capable de dfinir, selon la tche de lecture attendue, quelles sont les entits contenues dans les cartes qui expriment le contenu, et quelles sont celles qui reprsentent le contexte, ceci afin de dgager le code qui les lie. Par exemple, dans le cas dune tche de lecture se limitant un reprage des entits nommes, les segments dinformation reprer seront constitus des toponymes et de leurs marques visuelles de localisation (point, symbole, surface, etc.). Alors que dans le cas dune tche de lecture consistant reprer lorganisation spatiale dun fait en termes duniformit et de contraste, les seules entits porteuses de contenu seront des entits exclusivement constitues par des objets de forme surfacique dont lexpression permet dobserver leur degr de similarit. Nous avons montr lintrt du marquage des documents territorialiss et nous allons maintenant montrer de quelle manire il peut tre exploit par des outils appropris en vue de faciliter la resocialisation du corpus.
Revitalisation du corpus territorialis par la mise disposition doutils dexploitation des ressources numrises et smantiquement marques

La resocialisation dun corpus numris passe par sa revitalisation numrique, cest--dire par sa mise disposition de nouveaux publics pour de nouveaux usages. Dun point de vue technologique, la problmatique consiste donc concevoir les outils permettant lexploitation de

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 246/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

ces ressources smantiquement marques par les diffrents publics cibls, et, en amont de la conception, elle consiste analyser ces publics en termes de comptences, dattentes, et spcifier quels sont les usages attendus du corpus (cf. Nouveaux publics, nouveaux usages ). Un premier travail dexploration nous a permis didentifier trois catgories de publics (scientifique, touristique, scolaire) auxquelles sont associes des usages particuliers du corpus. Cette analyse a t prsente dans la premire partie de cet article. Elle constitue une base pour la spcification des outils dexploitation adapts chaque type de public, en termes dlments de description fonctionnels et interactionnels. Les descripteurs fonctionnels aident la spcification fonctionnelle des services attendus, les descripteurs interactionnels aident la spcification des modalits et/ou conditions dutilisation de ces services par les publics cibls, en fonction de leurs comptences et horizons dattente. Afin dillustrer en partie le travail restant faire sur la spcification des outils, nous prsentons, dans le paragraphe suivant, quelques lments de description fonctionnelle et interactionnelle, en slectionnant deux cas de figure, dune part, les outils dexploitation destins la communaut scientifique, et dautre part, les outils destins une communaut grand public.
Outils danalyse, de recherche, dannotation et de recomposition des ressources marques

Nous nous intressons ici aux outils permettant, un utilisateur expert du domaine (savant, chercheur), de prolonger, voire denrichir, ses activits de recherche traditionnelles, savoir, une tude approfondie du texte sur un corpus numris. Ces activits se basent sur lanalyse des uvres, selon de multiples critres (comme les lieux, les personnages, les faits, les styles, la construction du texte syntagmatique, rhtorique, etc.). Les analyses donnent lieu la production dditions savantes, cest--dire des ditions annotes des uvres analyses. Ainsi, dun point de vue fonctionnel, les services dvelopps doivent faciliter la recherche, lindexation, lhyperisation, lannotation et la recomposition de nouveaux documents partir de plusieurs sources analyses. La numrisation fournit de fait dintressants outils de recherche, danalyse et dindexation de type documentaire, bass pour la plupart dentre eux, sur les mta-informations associes aux documents, sur leur structure logique et, de manire moins riche, sur leur contenu. De plus, la conservation de documents dans un format XML facilite la mise disposition doutils dannotation

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 247/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

et dhyprisation permettant la mise en uvre dditions critiques. Toutefois, ces fonctionnalits ne sont pas suffisamment riches pour un public expert, elles doivent tre compltes par des outils de recherche et danalyse galement bass sur les contenus smantiques du corpus. Dans cette perspective, les outils dexploitation dun marquage spatio-temporel sont un apport fondamental lacceptation de loutil informatique comme support au travail des experts linguistiques et littraires. Le marquage spatio-temporel du corpus fournit un ensemble de documents munis dune indexation multidimensionnelle, cest--dire de plusieurs couches de balisage qui se superposent la structure logique du document. Ainsi, une exploitation des documents marqus laide dun explorateur XML enrichit dores et dj considrablement les possibilits de recherche documentaire disponibles. Par ailleurs, les outils de marquage prcdemment dcrits (cf. Analyse spatio-temporelle textuelle ) peuvent galement servir aux experts pour de nouveaux marquages ou de nouvelles analyses, par exemple, loccasion de la publication, par la communaut scientifique, de nouvelles ressources linguistiques et/ou gographiques extrieures permettant la validation et/ou lancrage gographique de ces nouvelles analyses spatio-temporelles. Dun point de vue interactionnel, on peut constater que les services identifis combinent des procds automatiss et semi-automatiss et ne relvent pas dun mme niveau de complexit dutilisation. Le public, expert en littrature et linguistique, ne matrise pas forcment la recherche documentaire, ni les divers outils danalyse, de marquage cits. Ainsi, toute mise en exploitation informatique doit prvoir lintgration de ces services lintrieur de plates-formes comptant un serveur dapplication, des outils de navigation, de visualisation, ddition hypertextuelle, des interfaces spcifiques, des outils dassistance adapts divers niveaux dexpertise technologique des utilisateurs, et pouvant aller jusqu la proposition de scnarios dutilisation prtablis.
Environnements scnariss de parcours, dcouverte et consultation des ressources marques

Concernant les outils permettant un utilisateur non expert du domaine (scolaire, grand public) daccder un corpus numris, lanalyse nous oriente plutt vers des outils daccs facilement disponibles dans des environnements numriques familiers (muses virtuels, bornes interactives, classes patrimoine, sites web, etc.) et associs des activits coutumires de ces publics. Ainsi, dun point de vue fonctionnel, les services dvelopps, essentiellement bass sur la navigation, doivent faciliter, voire orienter, lexploration et la dcouverte dun extrait du corpus en

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 248/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

immersion dans un ensemble plus vaste de ressources extrieures (gographie, hydrologie, histoire, faune, flore, vieilles cartes postales, archives sonores, htellerie, restauration, artisanat, circuits pdestres, questres, etc.) qui replacent la dcouverte dans une activit plus large, comme par exemple, un parcours touristique, ou bien pdagogique. Des services de recherche et dannotation doivent galement accompagner la navigation pour permettre chaque utilisateur de personnaliser et de sapproprier les parcours effectus. Le marquage spatio-temporel disponible sur le corpus serait alors exploit par le systme de navigation, de manire transparente pour le public. En effet, les balises (noms de lieux, de maisons, positions, dates, poques, etc.) constituent autant de possibles points de connexion directs entre lensemble des ressources du parcours dcouverte (touristique, pdagogique) et le corpus quil est possible dexploiter sous la forme doptions de navigation, complmentaires ou alternatives. De plus, partir des ressources du parcours et grce aux outils danalyse smantique du corpus, de nouveaux points de connexion peuvent tre calculs dans le corpus, afin denrichir encore les possibilits de navigation. Le marquage spatio-temporel et les outils danalyse smantique sont donc exploits, non pas directement par lutilisateur, mais par le service de prsentation des informations, qui propose des parcours organiss dun ensemble de ressources, en forte interaction avec le corpus auquel elles sont associes. Ainsi, le succs de ces services dpendra davantage de leurs qualits interactionnelles, de leur facilit dappropriation et de leur adquation avec les attentes des publics cibls que de lexhaustivit ou de la finesse dexploitation des marques situes lintrieur du corpus. Dun point de vue interactionnel, ces services peuvent alors tre dcrits comme des environnements scnariss de parcours de ressources marques. Nous entendons par scnario un ensemble de squences dinteractions obissant des conventions de communication identifies par un genre , cest--dire plaant lutilisateur dans un contexte dutilisation et dinterprtation qui lui sont familiers. Parmi les genres dapplications identifis, nous pouvons citer les applications ludiques, ducatives, encyclopdiques, informatives, promotionnelles, etc. Ainsi coloris dun ou plusieurs genres, les scnarios permettent une transmission organise des contenus de lapplication, dune part, en accord avec les intentions de communication souhaites par les prescripteurs et, dautre part, inscrite dans un contexte dutilisation familier de lutilisateur (Latapy, 2004). titre dillustration, les ressources et techniques dont nous disposons nous permettent dvoquer le scnario dun parcours dcouverte de type documentaire, usage touristique. Ainsi,

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 249/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

par exemple, dans un ensemble de ressources gographiques locales qui lui sont proposes, lutilisateur indique, le point de dpart de la visite quil souhaite effectuer, le point darrive et, ventuellement, les tapes quil compte faire. Le systme calcule alors, dans un premier temps, un premier parcours compos des points choisis accompagns de diffrentes ressources extrieures disponibles (informations climatiques, historiques, gastronomiques, hbergement, produits rgionaux, curiosits locales, etc.). Dans un deuxime temps, grce aux balises et aux outils de recherche spatio-temporelle disponibles, il puise dans le corpus littraire balis, des textes ou extraits de textes littraires illustrant les tapes prcdemment slectionnes. Puis, grce aux outils danalyse spatio-temporelle disponibles, il puise, galement dans le corpus, dautres lieux gographiquement proches de ces tapes. Ainsi, les nouveaux lieux issus du corpus permettent de complter et denrichir le parcours initialement calcul partir des seules ressources extrieures, alors que les textes permettent denrichir les ressources extrieures initialement slectionnes. Pour finir, cest ce parcours doublement enrichi qui est propos au visiteur.
Limites de nos propositions, perspectives dvolution

Nous avons montr comment un processus de numrisation, bas sur une exploitation de connaissances spatio-temporelles et dindex smantiques, permet une relle revitalisation dun corpus littraire restreint. Le rsultat vis est un corpus didactis et mis en valeur par des techniques de scnarisation. Les outils et techniques que nous proposons entranent un changement des modalits de lecture, dappropriation, de maniabilit technique et, in fine, dinterprtation du document. La didactisation rejoint la dfinition tymologique grecque de transmission du savoir dans la mesure o nous proposons un environnement accompagnant les divers utilisateurs humains dans les usages quils se dfinissent. Notre proposition se nourrit de divers travaux raliss dans des contextes diffrents de celui du corpus littraire et aboutissant des rsultats avrs. Toutefois, elle connat sur le corpus un certain nombre de limites qui constituent pour nous autant de pistes pour des travaux futurs. Une premire limite concerne la part restreinte du corpus territorialis pouvant tre traite par les outils de marquage que nous proposons. En effet, dune part, ces outils ne prennent en compte que des ressources textuelles et cartographiques. Or, les fonds territoriaux sont constitus de documents extrmement varis (cartes postales, photographies, extraits sonores ou vidos, dessins, etc.) quil est impossible dcarter, du moins long terme, dun projet de numrisation et de revitalisation du patrimoine. Il en rsulte, dun point de vue technologique, la ncessit dlargir le champ daction des outils de marquage et danalyse proposs, notamment des composantes iconographiques et multimdias. Dautre part,

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 250/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

ces outils ne permettent pas une analyse aussi fine pour tous les types de textes disponibles, comme par exemple les textes fictionnels. En effet, notre mthodologie, qui ne peut trouver que des marques typo-dispositionnelles et syntaxiques, et non spatiales, sappuie sur des ressources extrieures (atlas gographiques, etc.) qui nexistent pas dans le cas de textes fictionnels. Concernant la prise en compte de documents iconographiques (photographies, dessins, illustrations), des techniques danalyse sont aujourdhui oprationnelles sous la forme de produits commerciaux. On peut notamment citer le projet Imedia (Boujemaa et Jurie, 2003), bas sur la segmentation des images en diffrents objets identifis de manire unique selon une srie de descripteurs (couleur, texture, forme, configuration spatiale). Les identifiants sont ensuite analyss relativement une base de connaissances. De plus, lorsque des composantes textuelles, telles que titres et lgendes, accompagnent une iconographie, une chane de traitement contenant des analyseurs textuels peut leur tre appliqu, permettant alors dobtenir un marquage compatible avec les informations extraites des composantes textuelles. Concernant la prise en compte de documents sonores, les techniques danalyse existantes varient selon quils contiennent ou non de la parole. Dans le cas o la parole est prsente, lanalyse se fait gnralement en deux tapes (Garofolo, et alii, 2000). La premire tape consiste transcrire, laide dun systme de reconnaissance automatique de la parole, les documents audios comprenant de la parole en du texte enrichi de mta-donnes, afin de conserver toutes les informations (temps de parole, changement de locuteur, etc.). La deuxime tape consiste appliquer des techniques de traitement automatique des langues sur le texte enrichi, en prenant en compte les mta-donnes ainsi que la mesure de confiance affecte chaque mot lors de la transcription automatique (erreurs de transcriptions, absence de ponctuations, etc.). Ainsi, dans ce cas, le traitement du son se rapproche du traitement du texte aprs reconnaissance vocale (Vinet, 2004) avec la terminologie MPEG-7 (Martinez, et alii, 2002). Concernant la prise en compte de documents vidos (Lefvre, 2002), (Palakal et Tennant, 2002), les systmes danalyse existants se basent sur deux principaux concepts : la segmentation temporelle, permettant une dtection des changements de plan, et lanalyse des contenus pour chacun des plans pralablement identifis. La dtection des changements de plan est base sur une analyse globale des couleurs, de la texture et des mouvements. Lanalyse des contenus a pour objectif didentifier les objets pertinents, cest--dire ne faisant pas partie du fond de limage. Les techniques danalyse tirent galement partie des diverses composantes incluses dans un document vido : dialogues, sous-titrages, bande sonore. Ainsi, lanalyse de limage anime est complte par les rsultats des analyses des diffrentes composantes.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 251/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Une deuxime limite concerne la dtermination de la porte des rfrences spatiotemporelles identifies. En effet, lorsque lanalyse dtecte une marque spatio-temporelle lintrieur dune phrase, le problme qui se pose alors est de savoir dlimiter la porte de cette marque, cest--dire, la portion de texte (phrase, paragraphe, groupe de paragraphes) se rapportant smantiquement cette marque. Cest la connaissance du couple (marque, porte de cette marque) qui permettra une exploitation automatique ultrieure de lextrait de texte contenant la marque identifie, comme dans lexemple cit la fin de la section prcdente (cf. Environnements scnariss de parcours ). Dans ce cas, nous pensons que dautres techniques de marquage peuvent apporter une aide la rsolution de la problmatique pose, comme la thorie de lencadrement du discours, ou encore la thorie des structures rcursives. Dans la thorie de lencadrement du discours (Charolles, 1997), lauteur identifie des segments cadres de discours homognes par rapport un critre smantique (par exemple une localisation spatiale/temporelle). Ce critre est spcifi par une expression dtache en initiale de phrase (donc aisment reprable par un outil automatique) appele introducteur de cadre. Ainsi, cette segmentation permet de subdiviser et de rpartir les informations apportes par le discours au fur et mesure de son dveloppement . titre dexemple, le terme Autrefois est un cadre de discours temporel figurant dans lextrait de texte prsent dans la section intitule Illustration des objectifs fixs travers un exemple . Une limite de cette thorie concerne nanmoins la difficult savoir fermer les cadres ouverts. Quant la thorie des structures rcursives (RST Rhetorical Structure Theory) (Mann, 1999), elle avait t initialement conue dans le cadre des tudes sur la gnration automatique de texte pour proposer une explication de la cohrence des textes en identifiant des units et une reprsentation graphique pour les structures de texte. La RST fournit une analyse pour tout texte labor et cohrent, et cette analyse donne une explication argumente de la raison pour laquelle chaque lment du texte y a t inclus par lauteur. En postulant lexistence dune structure reliant les phrases entre elles, elle rend compte de la cohrence textuelle, dune faon indpendante des formes lexicales et grammaticales du texte. Ce type de structures discursives apparat immdiatement dune grande pertinence par rapport au corpus et la tche vise. En effet, tout dabord, les lments de cohrence fournis peuvent apporter une aide lestimation de la porte dune marque spatio-temporelle prcdemment identifie. De plus, laspect relatif la production de cohrence des textes peut galement tre directement utilis par un public de type savant souhaitant raliser une lecture critique, ou bien apporter des lments une interprtation communment admise.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 252/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Ainsi, les efforts devront aller dans le sens de la mise en cohrence et de lusage conjoint de ces diffrentes techniques. Notons cependant que la mise en cohrence de ces rsultats avec nos travaux est une relle difficult. En effet, dune part, les concepts traits et les niveaux dabstraction abords ne sont pas les mmes. Ainsi, par exemple, les indices de marquage pour les composants iconographiques et multimdias, comme la texture, la couleur, etc. sont dun niveau dabstraction plus bas que les marques smantiques releves au sein dun texte, pour lesquelles une nature spatiale ou temporelle est aisment reprable avec des outils existants. Dautre part, tous les travaux ne relvent pas du mme niveau dautomatisation. Cest le cas, en effet, des croquis et images, plus difficiles traiter, qui ncessitent un marquage manuel en amont de la part des experts. Ce travail dinterprtation et dhomognisation savre encore aujourdhui difficile automatiser.

Conclusion On le voit, la numrisation reprsente un tournant dans le cycle de vie du document. Du reste, il serait plus juste demployer lexpression cycle des vies car cest bien une nouvelle vie sous une nouvelle forme et selon des modalits dutilisation et de socialisation largies et amplement renouveles qui se profile pour le corpus oubli que nous avons voqu. On peut penser que la numrisation du document papier recle sur le plan technique un vritable potentiel de revitalisation pour les contenus convertis. Cependant, chaque corpus possde sa spcificit et le projet de numrisation sera li aux perspectives ultrieures de valorisation de ce patrimoine. Les conditions de sa resocialisation seront ncessairement tributaires des points forts qui se dgagent dune relecture actualise et historicise de larchive. Dans le cadre de notre intervention, cest la problmatique de la revitalisation des corpus restreints qui a t envisage et plus particulirement celle du patrimoine local ou territorialis. Nous avons circonscrit un corpus oubli et nous lavons revisit en nous appuyant sur une grille labore partir de la smiotique du territoire qui a constitu le point dentre commun aux chercheurs issus dhorizon et de spcialits aussi diffrentes que la littrature et linformatique. En nous appuyant sur la dimension dobjet culturel du territoire nous avons obtenu un ensemble de marqueurs territoriaux utiles pour de nombreux usagers. De mme, la dimension interactionnelle du territoire a permis de proposer lbauche de scnarios dinteractions susceptibles de diversifier les usages traditionnels du corpus. Ainsi, nous avons pu envisager trois types dusages : savant, pdagogique, et touristique, qui renouvellent lapproche du corpus converti en documentation lectronique. Cest donc une indniable volution qui se produit cette occasion

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 253/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

puisque les modalits de lecture, dappropriation et, par voie de consquence, dinterprtation du corpus, sont largement modifies. Toutefois, les outils de traitement de la documentation territorialise proposs ici nont pour linstant t expriments que sur des textes qui sinscrivaient au sein dun territoire et de lieux explicitement rfrencs dans dautres types de documents, savoir des cartes gographiques ou des supports iconographiques (cartes postales, photographies, etc.). Cet ancrage rfrentiel constitue lune des conditions de la resocialisation du corpus territorialis. Il reste aborder le redoutable problme pos par le texte de fiction. Cependant, les rsultats obtenus laissent esprer quune transposition des procdures de marquage comme dexploitation des documents dimension rfrentielle est en partie possible la condition de crer les ressources externes adaptes lunivers abord. Il faut notamment voquer llaboration dun panorama complet du systme autorfrentiel labor dans le cadre du texte de fiction ou dun corpus fictionnel consacr un territoire 205 afin de traiter la dimension spatiale de cet univers imaginaire comme un espace tangible. Dsormais, la numrisation se conoit de plus en plus autour de projets de diffusion et de valorisation du patrimoine auprs de publics spcialiss (communaut ducative) ou plus ouverts (tourisme). Dans le cas des corpus dintrt local linverse des grands fonds bibliographiques reconnus et plbiscits par les institutions scolaire et ditoriale et consacrs par la communaut universitaire, le critre scientifique nest peut-tre pas suffisant. Cest donc bien un projet culturel densemble dans le cadre plus vaste dun projet damnagement du territoire quil faut concevoir pour envisager de faon raliste lavenir des fonds numriss et leur transmission. En effet, la mise en valeur numrique des ressources est lie la cration de lieux dexposition (muses, comuses, salles publiques, offices de tourisme, lieux privs, etc.) ou de pratique (centres scolaires dinitiation au patrimoine, etc.), rels ou virtuels (sites, bornes interactives, etc.) et cela demande limplication croissante des instances et des institutions les plus diverses en tant quinitiateurs ou partenaires des projets. La conversion numrique des corpus bibliographiques ou culturels nest donc pas une procdure ferme sur elle-mme. cette opration technique initiale sont lies la question de la diffusion des fonds numriss et la problmatique complexe de leur communication. Elle ouvre de nouveaux horizons en matire de publics et dusages et invite les spcialistes des disciplines
205.

Lexemple du Seigneur des anneaux de Tolkien (2003) vient immdiatement lesprit.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 254/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

concernes renouveler leur rapport aux documents quils tudient dans le silence des bibliothques.

Bibliographie
BARBIER, J., Lgendes basques, Paris, ditions Delagrave, 1931. BARKOWSKY, T., FRESKA, C., Cognitive requirements on making and interpreting maps , dans Spatial Information theory : A Theorical Basis for GIS, Hirtle S. & Franck A. (coord.), International Conference COSIT, Laurel Highlands (USA), ditions Springer, 1997, p. 347-361. BERTIN, J., Smiologie graphique, 2e d., Paris, La Haye, ditions Mouton & Cie, 1973. BOUJEMAA, N., JURIE, F., Recherche dinformation par le contenu visuel , numro spcial de Technique et science informatiques RSTI srie TSI, Vol. 22, n9, 2003, 156 p. <http://wwwrocq.inria.fr/imedia/index.html> CARRIRE, J., Le paradigme de la communication cartographique : la hirarchisation du moi et du ici , Les ancrages du corps propre, Montral, ditions XYZ, sept. 2000, p. 87-110. CERQUAND, J.-F., Le chevalier de aro et le dragon , Lgendes et rcits populaires du Pays Basque, rcit par M. Etchebarne, transcrit par M. Basterreix, dialecte souletin, orthographe de la langue basque conforme ldition originale des traductions parue en 1872 dans le Bulletin des sciences, lettres et arts de Pau, p. 211 213, 1872. CHAROLLES, M., Lencadrement du discours - Univers, champs, domaines et espace , Cahier de recherche linguistique, n6, 1997. FRMONT, A., La Rgion, espace vcu, Paris, Flammarion, 1976-1999. GAIO, M., Traitements de linformation gographique : reprsentations et structures, Habilitation Diriger les Recherches, Universit de Caen Basse Normandie, dcembre 2001. GAROFOLO, J.-S., AUZANNE, C., VOORHEES, E.-M., The TREC Spoken Document Retrieval Track: A Success Story , Proceedings of the TREC Workshop, Avril 2000. GOULET, A., dition gntique des Caves du Vatican dAndr Gide, Universit de Sheffield, CD-Rom, Paris, Gallimard, 2000. GRANT, C., Head, The Map as Natural Language : A Paradigm for Understanding , New Insights in Cartographic Communication, Christopher Board (coord.), Monograph 31, Cartographica 21, n1, 1984.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 255/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

LATAPY, M., LOPISTGUY, P., DAGORRET, P., A genre approach to facilitate the intention of an application. A pedagogic experiment: risks prevention on the beach , EISTA04 International Conference on Education and Information Systems: Technologies and Applications, Orlando, Florida, USA, 21-25 juillet 2004. LAXALT, T., Fort des Arbailles - le souffle de la lgende , Pays Basque Magazine, n 32, 4e trimestre, 2003, p. 40 45. LEFVRE, S., Dtection dvnements dans une squence vido, Thse de doctorat de luniversit de Tours, dcembre 2002. LOTI, P., Ramuntcho, Paris, 1897, ditions Presses-Pockett, 1986. MANN, W.-C., Rhetorical Structure Theory (RTS) web site, <http://www.sfu.ca/rst/> [fvrier 2007]. MARTINEZ, J.-M., KOENEN, R., PEREIRA, F., MPEG-7, The Generic Multimedia Content Description Standard , IEEE Multimedia, avril-juin 2002, p.78-88. PALAKAL, M., TENNANT, S., CLIOH: Cultural Digital Library Indexing Our Heritage, Indiana University Forum on Digital Libraries, <http://clioh.informatics.iupui.edu/> [fvrier 2007] ; <http://www.dlib.indiana.edu/dlforum/> [fvrier 2007], April 16, 2002. PDAUQUE, R.-T., Document : forme, signe et mdium, les re-formulations du numrique , Working paper, Archive Ouverte en Sciences de lInformation et de la Communication, 8 juillet 2003, <http://archivesic.ccsd.cnrs.fr/documents/archives0/00/00/05/11/index_fr.htm> [fvrier 2007]. VIDEGAIN, C., et alii, Atlas linguistique de la langue basque, sous lgide lAcadmie de la Langue Basque, paratre. VINET, H., Description des contenus musicaux et applications, Confrence CIDE2004, La Rochelle, 2004.

Sciences de linformation et de la communication


BERNARD, M., Introduction aux tudes littraires assistes par ordinateur, Paris, PUF, 1999. BRUNET, R., Le Dchiffrement du Monde. Thorie et pratique de la gographie, Paris, Belin, 2001, collection Mappemonde. CHARTIER, R., Le Livre en rvolution, Paris, Textuel, 1997. DEBRAY, R., Introduction la mdiologie, Paris, PUF, 2000.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 256/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

FERRAND, N., Banque de donnes et hypertextes pour ltude du roman, Paris, PUF, 1997. HOOG, E., Tout garder ? Les dilemmes de la mmoire lge mdiatique , Le Dbat, n125, 2003. JEANNERET, Y., Y a-t-il vraiment des technologies de linformation ?, Septentrion, 2000. JOLY, M., Introduction lanalyse de limage, Paris, Nathan, 1993. KLINKERBERG, J.-M., Prcis de smiotique gnrale, Bruxelles, De Boeck, 1996. LVY, P., Les Technologies de lintelligence, Paris, La Dcouverte, 1990. LANCIEN, T., (coord.), Multimdia : les mutations du texte, Paris, ditions ENS, 2000. TOLKIEN, J.R.R., Le Seigneur des anneaux, Paris, Christian Bourgois, 2003. VANDENDORPE, Ch., Du papyrus lhypertexte, Paris, La Dcouverte, 1999.

Gographie et anthropologie
CLAVAL, P., La Gographie culturelle, Paris, Nathan, 1995. De CERTEAU, M., Lcriture de lhistoire, Paris, Gallimard, 1975. Di MO, G., Gographie sociale et territoires, Paris, Nathan, 1998. RAULIN, A., Anthropologie urbaine, Paris, Armand Colin, 2001. ZONABEND, F., Murs normandes, Paris, Christian Bourgois, 2003.

Sites web de rfrence


Bibliothque nationale de France : <http://gallica.bnf.fr> [fvrier 2007]. Archives littraires suisses : <http://www.nb.admin.ch/slb/> [fvrier 2007]. Bibliothque nationale du Luxembourg, Centre National de Littrature : <http://literaturarchiv.lu/fr> [fvrier 2007]. Bibliothque royale de Belgique : <http://www.aml.cfwb.be> [fvrier 2007]. Bibliothque nationale du Qubec : <http://www.bnquebec.ca/> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 257/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Archives dpartementales de Savoie : <http://www.sabaudia.org> [fvrier 2007]. Bibliothque municipale de Lisieux : <http://bmlisieux.com> [fvrier 2007]. Centre Flaubert de lUniversit de Rouen : <http://www.univ-rouen.fr/flaubert/> [fvrier 2007]. Projet IRMA : <http://www.unites.uqam.ca/irma/> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 258/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Apports du numrique au cycle de vie des documents papier : les documents scientifiques dans le rseau universitaire franais
Chrifa BOUKACEM-ZEGHMOURI Chercheur associ Laboratoire URSIDOC Universit Lyon 1
Rsum : Cet article sinscrit dans la suite dun travail de thse qui sest intress lvolution de laccs linformation scientifique dans le rseau universitaire franais, et ce de 1975 2000. En tenant compte de la spcificit du rseau franais et de la diversit de ses publics, nous proposons de nous pencher sur lintgration des ressources lectroniques dans les fonds des bibliothques universitaires et de limpact de cette intgration sur les collections traditionnelles papiers. Notre mthode de travail a une double dmarche, qualitative et quantitative. Les rsultats obtenus ont montr que lintgration des ressources lectroniques a permis de donner plus de visibilit aux collections papiers et de prolonger leur cycle de vie.

Mots Cls : Collections papiers/collections lectroniques/bibliothques universitaires/prt entre bibliothques/fourniture de documents.

Le rseau de la circulation des documents scientifiques en France est organis autour de deux ples, lInstitut de lInformation Scientifique et Technique (INIST) 206 et le rseau national des bibliothques universitaires. Notre article, qui sinscrit dans la continuit de nos travaux de thse (Boukacem, Chrifa, 2004), va sintresser exclusivement la circulation des documents dans les Bibliothques Universitaires (BU) franaises. Dans ce cadre, nous sous sommes intresses lvolution de laccs aux documents scientifiques, par le biais de lanalyse de lvolution des activits des services de prt entre bibliothques (PEB) dans les BU franaises, et ce de 1975 2001 207 . Les services de prt entre bibliothques rservs un public de chercheurs proposent deux types dactivits, destines complter les fonds locaux des bibliothques : dune part le prt ou lemprunt de documents physiques, dautre part la fourniture de reproductions. La premire activit concerne les ouvrages,
206. 207.

<http://www.inist.fr> [fvrier 2007]. En raison de la disponibilit des donnes, notre travail initialement limit 2000 a pu stendre lanne 2001.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 259/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

les thses, les traits, etc. La deuxime activit concerne les articles de priodiques ou chapitres douvrages. partir de la seconde moiti du
XX
e

sicle, mesure que le volume et le prix de la

documentation scientifique augmentaient, mettant mal les politiques et les budgets dacquisition des BU, le rle des services de PEB saffirmait dans la politique documentaire des bibliothques. Lorsque ces dernires se sont constitues en rseau et quelles ont mis en place des collections partages, les services de PEB ont permis laide des catalogues collectifs la consultation distance de ces fonds communs. Les services de PEB ont ainsi complt les fonds locaux des bibliothques. Aussi longtemps que la documentation scientifique na t que sur support papier, laugmentation des activits des services de PEB dune bibliothque sinterprtait comme la pertinence de ses collections. Or, partir de 1994-1995, avec le dploiement des ressources lectroniques et leur intgration progressive dans les collections des BU franaises, les activits des services de PEB, lchelle nationale franaise, ont prsent une baisse rgulire. Dans la suite de ce raisonnement, cette baisse, qui se confirme ce jour, marque la perte de vitesse de la pertinence des collections papiers. Traditionnellement, les bibliothques ont une mission de mdiation. En faisant la slection et lacquisition de documents, elles constituent des collections organises et cohrentes quelles mettent en relation avec des publics identifis. La consultation des collections par ces publics permet la mission de mdiation des bibliothques de se raliser. Or, voil que les collections de ces mmes bibliothques semblent tre contournes, au profit dun accs en ligne la documentation scientifique. La baisse des activits des services de PEB, essentiellement articules autour des repres physiques de la documentation papier, constitue le symptme le plus significatif de ce contournement. Dans ce qui suit, nous souhaiterions nous pencher sur limpact du dploiement puis sur celui de lintgration des collections lectroniques sur les collections papier des bibliothques. laide de donnes quantitatives et qualitatives exposes plus loin, notre but est de savoir si lon doit parler de concurrence ou de complmentarit entre les deux types de collections et didentifier quels sont les domaines o cette complmentarit ou cette concurrence se produisent. En dautres termes, il sagit de se demander si le numrique reprsente une menace ou bien un apport au cycle de vie des documents papiers. Rpondre ce double questionnement va nous permettre de repousser les limites des rsultats de notre travail de thse et daller plus loin dans lanalyse dune priode significative de lhistoire des BU franaises.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 260/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

propos de mthode Pour analyser les activits dun service sous langle de son volution, notre mthodologie sest dcline en deux tapes, lune dordre quantitative, lautre dordre qualitative.
Une premire tape quantitative

Les donnes chiffres sont essentielles pour aborder des activits quantifiables, telles que le prt entre bibliothques et la fourniture de documents. La premire tape de notre mthodologie a donc consist recueillir les donnes quantitatives relatives aux flux de demandes mises et de demandes reues enregistres par les BU. Le recueil de donnes sest ralis sur la tranche chronologique la plus longue possible, des fins dexploitation. Les donnes relatives aux activits des services de PEB sont publies dans lannuaire des bibliothques universitaires franaises qui publie annuellement les rsultats de lEnqute statistique gnrale des bibliothques universitaires (ESGBU). Les annuaires fournissent le nombre de demandes mises et le nombre de demandes reues par BU, et donnent le total de ces demandes. Cependant, ces donnes prsentent des limites : elles restent globales et ne renseignent ni sur le domaine, ni sur la nature de lactivit (proportion des prts physiques davec celle des reproductions). Seules des indications de pourcentages globaux sont fournis par les annuaires : en STM, le pourcentage est de 80 % de fourniture de documents et de 20 % de prt entre bibliothques ; en SHS, le pourcentage est de 40 % fourniture de documents contre 60 % prt entre bibliothques 208 . Enfin, au niveau national et toujours selon les indications des annuaires, la proportion de la fourniture de documents est de 80 % contre 20 % de prt entre bibliothques. Ainsi, partir de ces donnes, il a t possible de reconstituer lvolution des activits des services de PEB comme le montre la figure 1, ci-dessous, et ce de 1975 2001. En abscisses, figurent les annes et en ordonnes le nombre de transactions. La figure 1 est constitue de deux courbes : les demandes mises et les demandes reues. Elle a permis de proposer un premier canevas dinterprtation de lvolution globale nationale, sur la base duquel, nous avons pu proposer une premire analyse, globale.

208.

Ces donnes sont fournies par les annuaires des BU de 1988 2001.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 261/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Figure 1 : volution nationale franaise des activits des services de PEB, de 1975 2001

Une deuxime analyse, plus approfondie et plus limite dans le temps, a pu tre propose grce de nouvelles donnes quantitatives fournies par lAgence Bibliographique pour lEnseignement Suprieur (ABES). Ces donnes recouvrent une priode de six annes, de 1994 1999. Elles concernent le nombre de demandes mises et le nombre de demandes reues par les BU (activits de prts et de reproductions confondues), selon le dcoupage de lorganisation administrative des BU franaises par section :
La sant (fdration de disciplines mdicales). Les sciences et techniques. Le droit, les sciences conomiques et la gestion DSEG. Les lettres, les sciences humaines et sociales LSHS.

Compte tenu des nouvelles donnes lies cette priode circonscrite, il a t possible de comparer lvolution des activits des services de PEB, entre sections, et donc entre grands domaines. Ce travail, ralis sur une priode qui comprend le dploiement des ressources en ligne sur le Web et leur intgration progressive dans les fonds des BU, a t particulirement significatif pour notre travail danalyse.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 262/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Une deuxime tape qualitative

La deuxime tape de notre mthodologie de travail a t dapporter un complment qualitatif au pralable quantitatif dcrit ci-dessus. Pour ce faire, un chantillon dune quarantaine de BU franaises a t constitu, toutes sections confondues, rparties sur tout le rseau universitaire franais. Des entretiens semi-directifs ont t mens avec les responsables des services de prt entre bibliothques de ces BU. Les donnes qualitatives recueillies directement de notre terrain ont fait lobjet dune analyse thmatique prise en compte dans notre raisonnement pour construire notre dmonstration.

Analyser une activit en volution Langle danalyse que nous avons choisi pour rpondre notre problmatique est celui de lvolution des activits dun service. Cette approche rejoint les travaux de David Brown (1996) dans son ouvrage Electronic publishing and libraries: planning for the impact and growth to 2003. Brown propose une analyse de la circulation des documents dans son approche dynamique et volutive ; il identifie huit stades :
le prt entre bibliothques ; la fourniture de documents ; les bases de donnes en ligne commerciales ; les services de veille ; les services de fourniture la demande ; les diteurs de revues primaires ; la documentation personnalise ; les revues lectroniques.

Chacun de ces stades identifie un modle daccs aux documents. Les activits de prt entre bibliothques et de fourniture de documents, sinscrivent dans la trajectoire dvolution de lorganisation de la circulation des documents scientifiques et constituent les tout premiers stades de cette trajectoire. Applique sur notre terrain, la grille propose par Brown va sarticuler autour de deux priodes identifies sur la figure 1. La premire croissante va de 1975 1994 et est lie la circulation des documents papiers. La seconde, dcroissante va de 1995 2001 et comprend laccs en ligne aux documents dmatrialiss.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 263/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

De 1975 1994 : collections et bibliothques

Cette premire priode est caractrise par une augmentation annuelle moyenne des flux de lordre de 25 % pour les demandes mises et de 38 % pour les demandes reues. En observant la figure 1, nous pouvons distinguer trois acclrations provoques par des ralisations documentaires dans le rseau universitaire franais :
La premire intervient en 1980 et correspond la mise en place des Centres dAcquisition et de Diffusion de lInformation Scientifique et Technique (CADIST). Cette mesure vient au secours des bibliothques, mises en difficult par un contexte conomique difficile, fait dinsuffisances budgtaires et daugmentation des cots de la documentation. Des BU aux fonds riches et spcialiss ont accd au statut de CADIST et ont reu des subventions pour constituer des ples documentaires spcialiss qui acquirent et diffusent la documentation scientifique trangre, celle-ci tant la plus onreuse. Les CADIST ont constitu la premire structure identifiable dacquisition partage, de PEB et de FDD en France. La mise en relation, en complmentarit et donc en dpendance des fonds qui en a rsult a tout naturellement favoris laugmentation des flux de prt entre bibliothques et de fourniture de documents. La deuxime acclration intervient en 1983 et se prolonge jusquen 1985. Elle correspond dabord au lancement du CCN-PS (Catalogue Collectif National des Publications en Srie) en 1983. En 1985, les Services Communs de Documentation (SCD) sont venus sajouter aux structures prcdentes pour remdier la dispersion documentaire ne dune organisation morcele des campus, composs de BU et dunits de recherche spcialises, le plus souvent des bibliothques de laboratoires de petite taille relevant dorganismes multiples. Les SCD uvrent dans le cadre dune politique documentaire de coordination (dont les services de PEB peuvent faire partie) et se mobilisent pour une mutualisation des budgets dacquisition. La troisime acclration intervient en 1989, avec le lancement du Pancatalogue (catalogue collectif des monographies) en 1989, du catalogue collectif des thses disponible sur CD-Rom, Tl-Thses 209 et la mise en place de la messagerie PebNet en 1992 par lABES.

La croissance des activits des services de PEB dans la premire priode de la figure 1 se traduit galement par laffirmation des technologies informatiques qui ont men les BU un travail de coopration formalis par linfrastructure rseau. Le catalogage en rseau avec OCLC (Online Computer Library Center) en est certainement lun des exemples les plus vidents. Par ailleurs, la
209.

Les trois catalogues collectifs ont t fusionns ds 1999 dans le SUDOC (Systme universitaire de documentation) accessible par une interface web (http://www.sudoc.abes.fr [fvrier 2007]).

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 264/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

banalisation des bases de donnes sur Cd-Rom et en ligne (Medline, Inspec, Pascal) a contribu dans une large mesure faire connatre une offre documentaire non disponible dans les murs de la bibliothque, mais qui le devenait par le biais de la fourniture de documents. En outre, pendant cette priode, les tarifs de consultation des bases de donnes en ligne diminuaient. La croissance a pu ainsi continuer grce une offre de bases de donnes plus riche et une souplesse dutilisation obtenue avec la technologie client-serveur. Enfin, la croissance des activits des services de PEB sur cette priode a galement t lie lexacerbation de la crise de ldition priodique scientifique : les budgets insuffisants, les dsabonnements, linflation des prix dabonnements, sont autant dingrdients qui ont men une spirale infernale , qui a eu pour entre autres effets de faire exploser lactivit de fourniture de documents.
De 1995 2001 : contournement des bibliothques

La seconde priode de lvolution globale des activits des services de PEB est caractrise par une baisse annuelle moyenne de lordre de 24 % pour les demandes mises et de 28 % pour les demandes reues. Plusieurs facteurs concourent expliquer ce que nous considrons comme un abandon des fonds des bibliothques par les usagers, au profit dun accs en ligne des ressources lectroniques.
Dabord, des facteurs dordre conomique, qui ont jou le rle damorce la baisse nationale. A partir de 1995 et 1996, en raction la croissance des activits des services de PEB de la priode 1975-1994, les BU ont augment les tarifs des activits des services de PEB afin de faire face aux frais croissants de la demande dune part, et dautre part pour tenter de freiner celle-ci. Laugmentation de ces tarifs na pas t homogne dans le rseau. Certaines BU ont vu leurs usagers rduire le nombre de leurs demandes par mesure dconomie. En outre, en 1996, les prts nont plus bnfici de la franchise postale jusque-l pratique. Les rpercussions de cette disparition et la tarification instaure ont davantage touch les BU des sections LSHS et les sections DSEG, en raison de lactivit majoritaire de prt entre bibliothques. Ajoutons que dans ces domaines, les chercheurs ne bnficient pas des mmes moyens que leurs collgues des STM ; ils financent le plus souvent leurs recherches documentaires sur leurs propres deniers. Ensuite, des facteurs gestionnaires qui ont essouffl le service. Devant lampleur de laugmentation des flux sur la premire priode de la figure 1, les services de PEB ont continu fonctionner avec les mmes moyens matriels et humains. Certaines bibliothques CADIST ont pu recruter du personnel vacataire pour les priodes de pointe, mais cela est rest assez exceptionnel dans le rseau. Cette situation a surtout mis mal les dlais de traitement des demandes et denvois des

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 265/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

documents qui se sont considrablement allongs, passant parfois de 24 heures plus de 72 heures. La baisse est galement lie une saturation des services de PEB. Enfin, la baisse est exacerbe par un contexte documentaire renouvel par le Web et le numrique. En regard du renouvellement du contexte documentaire par le dploiement de ressources lectroniques scientifiques sur le Web (principalement des priodiques), la deuxime priode de la figure 1 est particulirement significative. En effet, avec larrive du Web au dbut des annes 1990, les potentialits dune diffusion des rsultats de la recherche en ligne ont rapidement t entrevues. Certaines communauts des sciences fondamentales, dont les pratiques renoncent une mdiation ditoriale, ont rorganis leur processus de communication scientifique autour du Web, lobjectif tant damliorer les dlais de diffusion.

Du ct des diteurs, on assiste un mouvement de concentration horizontale dans le secteur de ldition commerciale. Le rachat de la maison Pergamon par Elsevier marque au milieu des annes 1990 le dbut dun phnomne de fusions, de concentration et de rachats. Ce mouvement a rduit considrablement le nombre des diteurs, et augment le pouvoir et la marge de manuvre de mastodontes, tels quElsevier. Un mouvement de concentration verticale sensuit : les diteurs, acteurs monopolistiques de la diffusion de linformation, ont eu pour stratgie le contrle de la chane de diffusion, jusquau lecteur, afin de sassurer un maximum de bnfices. Pour ce faire, une stratgie prouve en conomie des marchs est engage pour rduire les intermdiaires et passer une diffusion directe lusager final (Chartron, G., 2002). Les partenariats redoublent auprs de fournisseurs de documents, de producteurs et serveurs de bases de donnes pour intgrer de nouveaux rles, de nouvelles fonctions, de nouvelles comptences et proposer lusager final une gamme complte de services. Cette convergence des acteurs vise aussi proposer des donnes factuelles, bibliographiques et du texte intgral, la fois. Pourtant, le rapport de force penche davantage pour les diteurs. Lconomie de ldition lectronique qui se met en place donne le jour des produits tels que ScienceDirect 210 dElsevier qui intgre dans une seule interface des services documentaires et des services ditoriaux, en vue dune diffusion de linformation directe lusager. En outre, face aux augmentations des prix des abonnements, les bibliothques ne connaissent pas daugmentations budgtaires corollaires. Il en rsulte quelles ont des difficults reconduire leurs abonnements et sont souvent accules au dsabonnement. De fait, le
210.

<http://www.sciencedirect.com> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 266/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

contournement prend effet. La baisse des activits des services de PEB en est le symptme le plus reprsentatif. En France, 1995 est lanne o officiellement Internet est introduit dans les bibliothques universitaires franaises (Van Dooren, B., 2000). Les premires ressources lectroniques font timidement leur apparition sur les sites Web des BU franaises, le plus souvent des BU STM et CADIST. mesure que loffre en ligne stoffe et se structure, les bibliothques font connaissance avec un nouveau type de documents, dont le support dmatrialis leur ouvre de nouvelles perspectives de diffusion, mais dont lconomie remet en question la stabilit des modles tablis. l'instar des bibliothques nord-amricaines, le consortium sest impos en France comme une raction aux drives de la politique ditoriale. La volont de sa mise en place sest clairement inscrite dans le projet des bibliothques de continuer saffirmer comme des mdiatrices, mettant en relation des collections et des usagers. Le dispositif du consortium permet de mutualiser les budgets des bibliothques pour acqurir davantage de ressources documentaires. Par ce biais, les bibliothques amliorent leurs couvertures documentaires et proposent leurs usagers des fonds hybrides : les collections lectroniques ctoient les collections papiers. Elles tentent de parer leur contournement. Toutefois, pour apprhender limpact dune intgration massive des catalogues des diteurs sur les collections papier, notre analyse doit prendre en compte le caractre segment du rseau universitaire franais, savoir son organisation administrative par sections ou par grands domaines. Il serait en effet imprudent davancer des interprtations et des explications globales. Dans ce qui suit, nous allons donc tenir compte de lapproche disciplinaire pour pondrer notre analyse.

La ncessit dune segmentation Pour interprter les courbes dvolution des activits des services de PEB par section, nous allons faire appel deux variables : la premire est lintgration des ressources numriques dans les fonds des BU. La seconde est la pertinence de cette intgration pour les publics qui elle sadresse ; en dautres termes lappropriation de ces ressources. travers une littrature professionnelle et de recherche ainsi que de notre analyse de terrain, les deux variables seront traites sous lclairage du rseau universitaire franais.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 267/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Intgration des collections lectroniques dans les fonds des BU

Le Consortium Universitaire de Priodiques Numriques (Couperin) 211 est le consortium le plus important en France, en termes de couverture documentaire. Mis en place le 1er juin 1999, il nest pas le premier pas vers lintgration de la documentation au sein de luniversit franaise. Les premiers groupements ont t thmatiques et fonds sur une assise locale lchelle dun campus (Nice) ou dune ville (Aix-Marseille pour Science Citation Index) [FRES99]. Cest donc la dmarche multidisciplinaire et nationale de Couperin qui lui confre cet impact et ce rle moteur. Il renforce le cur des collections des BU tout en les toffant pour les disciplines en marge. Les usagers prennent donc conscience dune offre jusque-l mconnue. Couperin a eu un rle moteur pour lintgration des collections lectroniques, particulirement les priodiques en ligne. Ces derniers sont en acquisition croissante : les rsultats de lenqute sur les ressources lectroniques pour lanne 2001 <http://www.sup.adc.education.fr/bib>, repris dans lannuaire des bibliothques universitaires de la mme anne montrent que le nombre des titres de priodiques en ligne dans le rseau universitaire franais a augment de 148 % depuis 1998. De faon corollaire, les dpenses documentaires sont en augmentation croissante avec plus de 82 % entre 1998 et 2001 avec 19,4 % daugmentation chaque anne pour les priodiques (MENRS, 2003). Toutefois, lintgration de ces ressources nest pas homogne dans le rseau :
Intgration dans les sections STM

Loffre de Couperin a dabord t une offre destine aux BU scientifiques. Ceci sexplique par le fait que ce sont des BU scientifiques qui ont t lorigine de cette initiative. mesure que dautres BU rejoignaient Couperin, les ngociations sacclraient pour de nouveaux produits (bases de donnes, littrature grise). Les BU des sections sant, ont rapidement suivi et la couverture documentaire a atteint 1200 priodiques en ligne pour 2001. Les bases de donnes, telles que Medline pour la sant ou Inspec pour la Physique sont ngocies au mme titre que les bouquets de revues. Les BU des autres sections, ainsi que des institutions documentaires non universitaires ont rejoint Couperin lui donnant ainsi un caractre pluridisciplinaire. Toutefois, aujourdhui son offre de lordre de plus de 2000 titres 212 , favorise principalement les fonds des bibliothques de section STM (Okret-Manville, Christine, 2002). Par ailleurs, le personnel des services de PEB de ces sections consacre plus de temps des tches de formation la recherche dinformation, et sinvestit dans la mise en place de sites web. Il
211. 212.

<http://www.couperin.org> [fvrier 2007]. <http://www.couperin.org> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 268/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

sagit de mettre en valeur les spcificits et les richesses de leurs collections ainsi que leurs services.
Intgration dans les sections LSHS

Lenqute annuelle sur lacquisition des ressources lectroniques rvle que davantage que les priodiques, ce sont les bases de donnes bibliographiques sur Cd-Rom principalement lhistoire et les sciences de lducation 213 qui sont acquises par les bibliothques des sections LSHS. Loffre du consortium Couperin pour les LSHS est trs marginale. Elle est sans doute lorigine de mobilisations vers loffre du consortium Chadwyck-Healey de Bell & Howell qui sadresse spcifiquement aux LSHS. Son offre est venue renforcer les ressources de ces domaines dans les bibliothques franaises. Mis en place en mars 2001, il donne accs des bases de donnes anglo-saxonnes et europennes (Okret-Manville, C., 2002). ce jour, les ressources lectroniques intgres aux collections des BU LSHS restent faibles. Ceci sexplique pour une grande partie par la modestie de loffre. Cette dernire est majoritairement internationale, dominante anglo-saxonne. Du ct francophone, entre la Belgique, la France, la Suisse et le Canada, cest ce dernier qui prsente loffre la plus importante (De Brito, M., 2001). Le secteur de ldition LSHS prsente des caractristiques propres, relatives au contexte social particulier dans lequel elles voluent. Dans une certaine mesure, elles concourent expliquer le retard, la lenteur et la modestie de loffre de ressources en ligne. Il faut dabord considrer le dficit ditorial : les analyses globales pointent le dsintrt des grands diteurs commerciaux pour les LSHS. Ceci sexplique par ltroitesse du lectorat qui soriente davantage vers louvrage, vecteur majeur de publication dun savoir abouti et quasi-intgral de la question aborde. Ldition de revues lectroniques prsente donc un potentiel conomique moindre pour les grands acteurs de ldition commerciale (Walford, L., 1998). Ils prfrent investir les champs les plus porteurs, ce qui se traduit par loffre STM massive qua pu connatre le march ces dernires annes. Les LSHS restent donc le parent pauvre de leurs portefeuilles. Chez les petits diteurs, la crainte dune absence de retour sur investissement ne favorise pas leur engagement dans la voie de ldition numrique (Walford, L., 1998) (Clment, C., 2000). En outre, malgr une volution de loffre de priodiques, une mise jour de ltude de Claire Lepeutrec (Lepeutrec, C., 2000) ralise autour des priodiques lectroniques en SHS a permis dobserver quun certain nombre des titres recenss avaient disparu. Les bases de donnes bibliographiques et les index quant eux continuent leur volution progressive.
213.

<http://www.sup.adc.education.fr/bib/> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 269/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

En revanche, la numrisation rtrospective de fonds patrimoniaux va peu peu simposer dans le panorama de loffre numrique LSHS. En partenariat avec les socits savantes, les bibliothques anglo-saxonnes se sont investies dans des projets de numrisation rtrospective de priodiques ds la premire moiti des annes 1990. Ces projets bien avancs ou achevs, marquent lavance anglo-saxonne sur le terrain franais, entre autres. Les deux exemples les plus connus sont :
MUSE
214

, projet dorigine publique, fond en 1995 par la John Hopkins

University Press. Son antriorit remonte 1996. Son portefeuille compte plus de 150 revues en LSHS. Limpact de MUSE sur le milieu des bibliothques est celui de les avoir interpelles sur la place de ldition acadmique travers le support dmatrialis. JSTOR
215

(Journal Storage) initiative, but non lucratif, mise en place en

janvier 1997 par la Fondation Andrew Mellon. JSTOR donne accs plus dune centaine de priodiques en LSHS (Alison, Murphy, 2000), dont lantriorit remonte dans certains cas jusquen 1900.

En France, CEFAEL 216 sintresse exclusivement aux ouvrages. Cest un projet linitiative de la bibliothque numrique de lcole Franaise dAthnes (EFA). Il propose laccs lensemble des ouvrages publis par lEFA depuis 1877, soit 500 volumes. Au vu de la diversit des partenaires (EFA, Maison de lOrient et de la Mditerrane, CINES, etc.), CEFAEL est un projet collaboratif. Cest aussi un projet interdisciplinaire car il intgre une dimension scientifique et technique lie son dploiement et ses acteurs ; ceci le distingue des autres projets orientation SHS, tels que JSTOR.
Intgration dans les sections DSEG

En DSEG, linstar des LSHS, on subit la fois les contrecoups de la crise ditoriale en STM et celle moins sensible des autres domaines. Lanalyse des entretiens a rvl que les BU provinciales des sections DSEG se sont vues parfois rduire leurs dpenses documentaires pour aider les bibliothques des sections STM faire face la crise inflationniste. Cest pourquoi, rejoindre un consortium national ou se constituer en consortium thmatique a fait partie des perspectives videntes de nos interlocuteurs. Leur discours sest appuy sur un raisonnement conomique destin faire face aux cots de la documentation par une fdration de ressources et un regroupement de moyens. Rapidement, aprs la cration de Couperin en 1999 qui avait encore cette poque un caractre scientifique, le Ministre a annonc sa volont de crer un consortium dacquisition de bases de donnes et de Cd-Rom, dont le projet a t confi deux CADIST
214 . 215.

<http://muse.jhu.edu/> [fvrier 2007]. <http://www.jstor.org> [fvrier 2007]. 216. <http://cefael.efa.gr> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 270/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

pilotes : Cujas (Droit) et Dauphine (Sciences conomiques et gestion). Les ngociations ralises ont permis de complter loffre pluridisciplinaire en ressources appropries pour le groupement des sections DSEG. En conomie, la Base ABI Inform (Proquest Information & Learning), incontournable en gestion, a fait lobjet dun regroupement dachat. Elle permet la consultation des sommaires de 1500 revues et offre le texte intgral de 800 titres dont lantriorit peut remonter jusquen 1987 (Perol-Isaacson, Dominique, 2002). En Droit, les bases Lamyline, Jurisfrance, Doctrinal et Lexbase ont t ngocies par la bibliothque de Cujas. Un groupe de pilotage a t cr pour regrouper le bassin parisien et la province. La ngociation des tarifs sest faite au nombre des bibliothques adhrentes. Lexemple des sections DSEG montre le rle actif dont ont fait preuve les bibliothques CADIST pour lintgration des ressources lectroniques dans le rseau universitaire.
Appropriation des ressources lectroniques

Lintgration des ressources lectroniques dans les sections universitaires doit tre aborde dans le sens de sa pertinence pour les publics qui elle sadresse. Lusage ou le non-usage est un facteur rvlateur de cette pertinence. Il aiguille les politiques documentaires des bibliothques pour freiner ou renforcer lintgration des ressources lectroniques dans leurs collections.
Appropriation dans les sections STM

La synthse ralise par Annag Mah en 2001 concernant les usages en STM, nous informe que jusquen 1992, les premires tudes ralises faisaient tat dun non-usage des ressources lectroniques par ces publics. Ceci est li un attachement au papier et une offre limite. En revanche, partir de 1994-1995, de nombreuses tudes ralises autour de ces disciplines trouvent matire observation et analyse. Loffre de ressources lectronique, particulirement de priodiques, connat une volution croissante. Elle va par la mme occasion permettre ses publics de dvelopper de nombreux usages. Pour les publics des sections STM, les sources consultes dans le cadre de leur activit de recherche sont majoritairement composes darticles, quils identifient le plus souvent grce aux bases de donnes. Ces dernires sont des outils didentification trs priss par les publics de 3e cycle des sections STM. Souscrites par les bibliothques, elles proposent depuis 1995-1996 du texte intgral. Des formations organises par les personnels des services de PEB aident les usagers utiliser ces outils pour leur activit de recherche dinformation. En outre, la disponibilit en ligne des bases de donnes permet aux usagers de les consulter partir de leur bureau. On peut sans doute considrer que les bases de donnes ont constitu pour les publics STM lun des premiers facteurs incitatifs une migration sur le Web.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 271/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Cette migration des chercheurs a t exacerbe par laugmentation des tarifs des services du PEB. La gratuit du Web, la possibilit relle ou factice de retrouver des documents scientifiques sur la toile que lon pouvait imprimer dun clic de souris a t une raison significative pour que le public STM se dtourne des services de PEB. En regard du changement du rapport des publics STM la recherche bibliographique, leur recours aux prestations de fourniture de documents semble sorienter encore plus vers une documentation priodique anglo-saxonne. La caractristique anglo-saxonne dominante au Web au moins ses dbuts et la caractristique tout aussi dominante de loffre de ressources en ligne des diteurs, concourent expliquer cet intrt accru des publics STM pour la documentation trangre qui dispose dune version lectronique.
Les sections LSHS

Les tudes dusages ralises autour des domaines LSHS sont tardives, peu nombreuses et souvent amalgames celles en DSEG. Ce constat est la consquence de la modestie et de la lenteur de progression de loffre des ressources lectroniques en LSHS. Les priodiques en ligne, disponibles la fin des annes 1990 nont pas t lobjet dune demande comparable celle de la demande des priodiques en ligne en STM. Les pratiques informatives des publics des sections LSHS (prennit de linformation, le cadre solitaire de la recherche, le rayonnement limit le plus souvent au contexte national) ne sont pas trangres linertie et au retard qui qualifient leurs usages autour des ressources lectroniques. Le comportement des publics de ces sections vis--vis des ressources lectroniques leurs dbuts peut se rsumer globalement une mconnaissance, une dfiance et un refus dusage. Ce constat a t confort par des tudes faites sur un public des LSHS (Pernoo-Beccache, M., 2002). Parmi les raisons identifies pour analyser plus finement ce non-usage, les tudes pointent lincomptence des chercheurs, leur dfiance vis--vis de travaux autopublis, la difficult de lecture lcran, labsence de raison dusage et leur attachement presque viscral au papier 217 . Toutefois, il faut ajouter que le malaise des chercheurs des sections LSHS sexplique aussi par une offre peu mergente, par une absence de masse critique de linformation scientifique disponible sur le Web et un manque de visibilit (Clment, C., 2000). Les conclusions des premires tudes dusages, du reste peu nombreuses, montrent que les usages dmarrent lentement et progressivement. Lintgration importante dInternet et de la messagerie est le moteur de ce dmarrage progressif. Toutefois, sur notre terrain, nous navons pas pu confirmer ce constat. Peu de matire a t livre par les responsables des services de PEB des sections LSHS. Leur mconnaissance, leur
217.

(http://www.jstor.org/bibliography.htm#97 [2004]).

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 272/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

ignorance et parfois leur dsintrt pour le contexte numrique ont t nots de manire transversale. Seules les BU CADIST ont pu apporter un clairage diffrent. Lanalyse de nos entretiens rvle des responsables de services souvent proccups, parfois intresss par la dmatrialisation des documents mais trs peu concerns. En outre, loffre a t peu mdiatise par les bibliothques, ce qui na pas permis dentrevoir les bouleversements observs en STM. Ceci se confirme par le rapport ministriel Kosmos sur les sites Web (Ministre de la Recherche, 2000) des universits franaises qui note un dficit dans les sections LSHS. Ceci explique galement lapprciation des portails thmatiques spcialiss qui permettent de rassembler en un seul point, des ressources disperses et a priori peu visibles. partir de 1999-2000, les tudes montrent une croissance des usages en quantit (des usages plus nombreux) et en qualit (des usages plus diversifis). Elle se cristallise autour des articles numriss ; lintrt et limpact des projets de numrisation rtrospective tels que MUSE et JSTOR sont significatifs. Ce phnomne se renforce dautant plus que les chercheurs ont recours une documentation rtrospective, dj valide, dont la qualit scientifique nest plus dmontrer. Il ressort que le facteur social est li au facteur conomique de loffre. Linertie des pratiques des chercheurs est lie une offre peu mergente et labsence dune masse critique de linformation scientifique disponible sur le Web (Clment, C., 2000). Nous pouvons aussi avancer que le contraire se confirme galement : le retard de loffre sexplique par le dsintrt des grands diteurs commerciaux pour ces disciplines peu porteuses denjeux commerciaux et conomiques, et cela en raison des usages limits du public des chercheurs. Les petits diteurs, pour leur part, sont retards par linsuffisance de leurs moyens.
Les sections DSEG

De plus en plus nombreux aller vers Internet, les usagers des sections DSEG sont moins laise avec ce mdia si lon venait les comparer leurs collgues des sciences et de la sant : leurs rticences sont dailleurs symptomatiques dune inadquation de la technique leurs pratiques, cela est particulirement le cas pour les juristes (Guthrie, K., 2001). En cela, les publics DSEG rejoignent les publics STM aux dbuts de loffre de ressources en ligne. Les usages restreints sont corollaires la modestie de loffre. Dailleurs, toujours en comparaison aux STM, les tudes dusages dans ces domaines sont limites en tendue et en quantit. Lintrt de plus en plus marqu du public des sections DSEG pour les bases de donnes sur Cd-Rom puis en ligne (avec une mise jour rgulire) telles que Francis, MLA, Doc-Thses, EconLit, etc. a contribu la dcouverte dune offre documentaire non disponible dans les murs de la bibliothque, mais qui le devenait par le biais des prestations de la fourniture de documents.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 273/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

En outre, les bibliothcaires ont not une certaine aisance chez ces usagers quant lutilisation de ces outils et la formulation de leurs demandes. Cela a eu pour consquence laugmentation des flux de fourniture de documents. Les usagers sont devenus davantage demandeurs dune information rcente, et le priodique, principalement anglo-saxon (Melot, A., 2002), est devenu un outil de travail tout aussi privilgi que les ouvrages ou les thses. Lamplification des flux des activits des services de PEB sest dabord inscrite dans une dynamique qui repose sur des besoins dvelopps et des usages en construction autour des bases de donnes en ligne. En 1999 et 2000, la croissance de loffre des ressources en ligne rencontre la croissance des usages. Cette croissance se confirme sur notre terrain o les responsables des services de PEB qui accompagnent leurs publics lutilisation des ressources en ligne notent quils y sont ractifs. Daprs une tude rcente (Perol-Isaacson, D., 2002) ralise sur un chantillon denseignantschercheurs et doctorants la BU Dauphine, CADIST Sciences conomiques, ces ressources disponibles correspondent davantage leurs besoins de recherche et leur ide de la consultation, cest--dire partir de leur poste de travail. Les auteurs de ltude soulignent que ces ressources, principalement des bases de donnes en ligne, reproduisent plus ou moins sous forme lectronique la dmarche documentaire qui a prcd lInternet . Cela dit, il est important dintroduire une nuance. Cette ractivit est souligne principalement pour les usagers des sciences conomiques, de la gestion et des finances pour qui les conclusions des tudes dusages laissent mme envisager un passage au tout lectronique. Pour les usagers juristes, il est primordial de pondrer le constat car ils restent pour les besoins de leurs disciplines encore lis la documentation papier rtrospective, et sous forme de monographie. ce propos, en droit, du fait des besoins en ouvrages franais, dits par des diteurs nationaux, il est difficile de ngocier car les diteurs sont conscients de leur pouvoir et dune certaine faon de leur monopole (Polity, Y., 2001).
volution des activits des services de PEB de 1995 1999, par section
volution dans les sections STM

Les figures 2 et 3 reprsentent respectivement lvolution des activits des services de PEB dans les sections Sant et Sciences Techniques. linstar de la figure 1, elles montrent que les activits des services de PEB de ces sections ont connu, sur la mme priode, le mme phnomne de dcroissance au niveau national. La baisse dans les sections STM intervient ds 1995. Nous sommes en droit de supposer que la disparition de la franchise postale a pu contribuer cette baisse. Mais considrant que la

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 274/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

proportion du prt entre bibliothques dans les activits des services STM est de 20 %, cette contribution reste marginale. Les donnes recueillies directement auprs des professionnels et des ESGBU rvlent que la baisse observe est principalement celle de la fourniture de documents. Quant elle, lactivit de prt entre bibliothques, minoritaire, est reste relativement stable. Compte tenu du fait que les services de PEB des sections STM comptabilisent les flux les plus importants du rseau, la baisse consquente de la fourniture de documents a donc, dans une large mesure, entran la baisse nationale. Ainsi, il nous parat cohrent davancer que les critres identifis pour expliquer la baisse globale concourent expliquer la baisse dans les sections STM.

Figure 2 : volution des activits des services de PEB dans les sections Sant, de 1994 1999

La disponibilit progressive et croissante de la presse priodique scientifique sur le Web qui correspond la priode de la baisse que nous analysons, semble donc symptomatique dun dtournement des usagers vers dautres moyens daccs directs la documentation scientifique. Certains professionnels ont mme envisag le dclin du service, tandis que dautres ont tent de rflchir sa rorientation vers un service de proximit. Cependant, les avis restent partags. Le service du PEB reste lunique moyen daccs la documentation rtrospective qui continue faire lobjet dune demande.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 275/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Figure 3 : volution des activits des services de PEB dans les sections Sciences et Techniques, de 1994 1999

Par ailleurs, les entretiens mens dans ces sections rvlent une augmentation du pourcentage de la fourniture de documents dans le total des flux. Alors que la baisse des activits se confirme, lactivit de fourniture de documents devient quasi totale. Nous ne disposons pas encore de chiffres confirmant ce phnomne ; les entretiens sont les uniques tmoins de cette augmentation.

volution dans les sections LSHS

La figure 4, ci-dessous, permet dobserver lvolution des activits des services de PEB dans les sections LSHS de 1994 1999.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 276/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Figure 4 : volution des activits des services de PEB dans les sections LSHS, de 1994 1999

Lobservation de la figure 4 nous permet de retrouver limpact de la suppression de la franchise postale survenue en 1996 : les reues en LSHS accusent une baisse marque. En effet, comme nous lavons soulign plus haut, pour les publics des sections LSHS, les monographies reprsentent la source principale dinformation ; les articles de priodiques ont un rle moins important. Cest pourquoi, de manire prvisible, les monographies, y compris anciennes, et les thses, constituent les documents les plus demands par les publics. La courbe des demandes mises sinflchit galement sous le coup de la disparition de la franchise postale, mais de manire beaucoup plus progressive. Aprs 1996, les activits augmentent. Les services de PEB de ces sections, doivent ce renflouement la subvention du Ministre, spcifiquement alloue aux prts 218 . En revanche, entre 1996 et 1999, on observe nettement que lvolution des activits marque une stagnation. Elle soriente vers une stabilisation.

volution dans les sections DSEG

La figure 5, ci-dessous, reprsente lvolution des activits des services de PEB dans les sections DSEG.
218.

Les autres sections du rseau ont galement bnfici de cette subvention. Les retours de cette subvention sur lactivit du PEB sont contrasts, selon les sections. Nous invitons le lecteur sy rfrer dans les autres chapitres, IV et VI.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 277/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Figure 5 : volution des activits des services de PEB dans les sections DSEG, de 1994 1999

Lvolution dans ces sections, contre-courant de lvolution nationale est marque par deux priodes : La premire priode (de 94 96) est celle dune baisse, la fois des demandes mises et des demandes reues, survenue en 1996 que nous expliquons par limpact de la disparition de la franchise postale dans les BU. partir de cette observation on peut mesurer limportance des prts dans les services de PEB des sections DSEG. En effet, jusquen 1996, les prts douvrages taient gratuits ; aprs la disparition de la franchise postale, ils sont passs directement une fourchette de prix entre 10 et 50 FF et cela dans tout le rseau universitaire. Cette fourchette est considrable pour un usager dont la documentation nest pas toujours finance par son laboratoire de recherche. Le tarif devient encore plus important si lon considre que les usagers des sections DSEG ont souvent recours lactivit du prt entre bibliothques, en raison de la place que tient la monographie, louvrage de thse et le trait de droit dans la documentation recherche. Ceci concourt donc expliquer la baisse. En cela, lvolution des activits des services de PEB dans les sections DSEG suit la mme volution que celle de lvolution globale. La seconde priode de la courbe (1996-1999) est celle dune augmentation (demandes mises demandes reues) sensible et rgulire. Llan que prend cette augmentation ne permet pas

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 278/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

de dceler des signes de ralentissement. Cette augmentation est intressante car elle intervient une priode o les ressources lectroniques du domaine sintgrent aux fonds des bibliothques. Un plus grand accs aux bases de donnes a permis damplifier le rythme des transactions de fourniture de documents. Tandis que les tarifs de consultations des bases de donnes en ligne diminuaient, le rythme des transactions augmentait. Cette croissance sest renforce grce une offre de bases de donnes plus riche et une souplesse dutilisation obtenue avec les technologies client-serveurs.

Collections papiers versus collections lectroniques Dans ce qui a prcd, nous avons fait converger deux variables : lintgration de collections lectroniques dans les fonds de BU, leur appropriation par les publics de ces BU. Notre but a t dutiliser cette convergence pour mieux comprendre lvolution des activits des services de PEB, et par l mme, la pertinence des collections papiers pour les usagers.
Les indices dune complmentarit

Malgr les ingalits dintgration dans les fonds des BU franaises, les ingalits dintgration par les usagers des diffrentes sections et malgr lvolution contraste des activits des services de PEB, nous pouvons avancer que globalement, la pertinence des collections papiers se maintient dans toutes les sections du rseau universitaire franais. Les collections lectroniques ne semblent donc pas se positionner comme des fonds concurrents aux fonds papiers. En mme temps, les entretiens mens sur notre terrain montrent que lintgration des ressources lectroniques semble avoir stimul la fourniture de documents dans les quatre sections du rseau. Cette croissance demanderait tre vrifie par des chiffres. En labsence de ces donnes, linterprtation que nous proposons, dans les limites de son cadre danalyse, sappuie sur trois facteurs :
Le premier facteur, est celui du face face de la notion de collection papier avec celle de la collection lectronique. La premire est la base du savoir-faire bibliothconomique qui consiste slectionner, acqurir et traiter des documents individuels pour les intgrer dans une collection organise et cohrente, destine un public dusager. La seconde comprend le portefeuille dun diteur, voir de plusieurs diteurs, ngocis au meilleur prix et pour lusage le plus large, dans le cadre dune licence daccs. Dans ce face face, le savoir-faire des bibliothques de constituer des collections destines des catgories dusagers sefface au

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 279/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

profit dune acquisition intgrale du portefeuille de lditeur, des big deals , destins tous. Le deuxime facteur qui dcoule du premier est une activit de recherche dinformation interdisciplinaire et rtrospective qui se rvle lors de nos entretiens. En effet, la couverture de Couperin a conduit un largissement considrable du champ de la recherche bibliographique. Laccs largi aux rfrences bibliographiques internationales, la possibilit de faire des recherches rtrospectives et/ou croises, de les archiver, la rapidit daccs et les liens entre les articles a t dun apport sans prcdent pour les usagers. Ils exprimeraient une demande plus importante, et plus interdisciplinaire. De mme, ils ne se cantonneraient plus leurs titres habituels et feraient preuve de curiosit dans les disciplines connexes aux leurs. Ils dcloisonnent donc leurs recherches bibliographiques qui tendent leur corpus documentaire de nouvelles rfrences. Or, loffre de Couperin est large mais manque encore de profondeur. Les chercheurs sont donc appels piocher dans les fonds rtrospectifs, papiers. Ceci favorise donc la croissance de la fourniture de documents. Le troisime facteur est celui de la banalisation des bases de donnes bibliographiques et texte intgral, tous domaines confondus. Ces bases de donnes, accessibles en ligne et donc depuis le bureau du chercheur, ont permis ces derniers de renouveler leurs ambitions de recherche documentaire. Les usagers des sections STM rds des bases traditionnelles dcouvrent de nouveaux produits avec de nouvelles possibilits de recherche. Les usagers des sections DSEG et LSHS, pour une partie dentre eux, dcouvrent les possibilits de recherche et de lecture de bases de donnes en ligne, avec possibilit dimpression de leurs documents. Les usagers dcouvrent donc une documentation courante, acquise dans le cadre des consortiums auxquels participent leurs bibliothques, mais galement une documentation rtrospective qui les renvoie aux collections papiers du rseau des BU.

Comme nous lavons soulign plus haut, ces lments de rponse demanderaient bien sr tre approfondis et vrifis par des donnes chiffres. De rcents contacts avec lABES, dans le cadre dun groupe de travail AURA 219 , permettraient prochainement de vrifier ce que nous avanons.
219.

Association du rseau des tablissements utilisateurs de lAgence bibliographique de lenseignement suprieur.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 280/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Conclusion Lintgration de ressources lectroniques (priodiques, bases de donnes) dans les fonds des BU franaises a t porteuse denjeux importants pour la continuit de leur rle et de leurs fonds. Lanalyse de notre terrain rvle que les publics des diffrentes sections universitaires ont montr une appropriation contraste mais progressive des ressources lectroniques. De mme, nous avons pu observer de manire transversale au rseau des BU que lintgration des ressources lectroniques semble avoir donn plus de visibilit aux ressources papiers. Plutt quun seul cycle de vie, il existe plusieurs cycles de vies des documents : les STM reviennent au papier en souvrant sur linterdisciplinarit et sur les fonds rtrospectifs pour largir le champ de la recherche ; les sciences conomiques et la gestion renforcent leurs pratiques informatives sur les articles de priodiques grce des bases de donnes en ligne ; enfin, les LSHS apprcient la possibilit de consulter distance des fonds rtrospectifs quelquefois patrimoniaux numriss au mme titre quelles commencent apprcier la consultation en ligne de priodiques courants. En outre, en mettant en complmentarit des collections lectroniques et des collections papiers, lallongement dans le cycle de vie des documents papiers, tous domaines confondus se confirme. Il bouleverse les pratiques traditionnelles de consultation papiers. Il permet aussi dapprhender la consultation des collections traditionnelles de manire plus approfondie et plus complte. Par ce biais, la charge intellectuelle dorientation que reprsente toute collection est souligne. Cest la ralisation entire du rle dune collection.

Glossaire ABES : Agence Bibliographique de lEnseignement Suprieur. AURA : Association du rseau des tablissements utilisateurs de lAgence Bibliographique de lenseignement suprieur BU : Bibliothque Universitaire. CADIST : Centre dAcquisition et de Diffusion de lInformation Scientifique et Technique. COUPERIN : COnsortium Universitaire de PERiodiques Numriques. DSEG : Droit, Sciences Economiques, Gestion. ESGBU : Enqute Statistique Gnrale des Bibliothques Universitaires. IST : Information Scientifique et Technique.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 281/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

LSHS : Lettres, Sciences Humaines et Sociales. OCLC : Online Computer Library Center. PEB : services de Prt Entre Bibliothques. SCD : Service Commun de Documentation. SUDOC : Systme Universitaire de Documentation.

Bibliographie
BOUKACEM, C., Du prt entre bibliothques la bibliothque virtuelle : une volution contraste des bibliothques universitaires franaises selon la discipline, sous la direction de Jean-Michel Salan. Universit Lyon 2, mai 2004. BROWN, D.- J., Electronic publishing and libraries: planning for the impact and growth to 2003, Bowker Saur, 1996, 200 p. CHARTRON, G., Les chercheurs et la documentation numrique : nouveaux services et usages, Paris, ditions du Cercle de la librairie, 2002, 268 p. CLMENT, C., BONVIN, M., Les priodiques lectroniques en sciences humaines et sociales : analyse de l'offre et test de catalogage sur VTLS la bibliothque de Lausanne-Dorigny, 2000, <http://www.unil.ch/bcu> [fvrier 2007]. De BRITO, M., Rapport pour la rgion Rhne-Alpes : Les priodiques francophones et les modles numriques : une analyse comparative des indicateurs bibliographiques internationaux, Novembre 2001. FRESCHARD, C., OKRET, C., La documentation lectronique : tat des lieux et perspectives de dveloppement dans les bibliothques des tablissements denseignement suprieur franais , Bulletin des bibliothques de France, 1999, n4, p. 62-65, <http://bbf.enssib.fr> [fvrier 2007]. GUICHARD, ., Comprendre les usages de lInternet, Presses de lcole Normale Suprieure, 2001, 169 p. GUTHRIE, K., What do faculty think of electronic resources , ALA participantsMeeting, juin 2001. <http://www.ariadne.ac.uk/issue24/jstor> [fvrier 2007]. LEPEUTREC, C., Les nouvelles revues francophones exclusivement numriques en sciences humaines et sociales, Juin 2000, <http://www.ext.upmc.fr/urfist/revueshs/newrev.htm> [fvrier 2007]. MAH, A., La Communication scientifique en (r)volution : lintgration des revues lectroniques dans les pratiques informationnelles des chercheurs en sciences de la nature comme rvlateur des mutations

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 282/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

du modle traditionnel de la communication scientifique, (Soutenue le 16 dcembre 2002), <http://www.enssib.fr/article2.php?id_cat=76&idx=37&cat=La+biblioth%E8que> [fvrier 2007]. MELOT, A., Quelques rflexions sur lvolution de loffre ditoriale et des pratiques informationnelles des chercheurs dans une cole de commerce : le Groupe HEC , Chartron, G. (dir.), Les chercheurs et la documentation numrique : nouveaux services et usages, Paris, ditions du Cercle de la librairie, 2001, 268 p. Ministre de lducation nationale et de la Recherche scientifique, Annuaire des bibliothques Universitaires : Rsultats de lenqute statistique gnrale auprs des bibliothques universitaires, MENRS-SDB, 1988-2000. Ministre de la recherche, tude des sites web des universits (juin 2000) : tude Kosmos, <http://www.educnet.education.fr/chrgt/web-u2000.doc> [fvrier 2007]. MUET, F., Services et revues lectroniques dans l'enseignement suprieur : Synthse de quelques enqutes rcentes sur les usages , Bulletin des bibliothques de France, 1999, n5, p. 18-23, <http://bbf.enssib.fr> [fvrier 2007]. MURPHY, A., JSTOR usage , <http://www.ariadne.ac.uk/issue24/jstor/> [fvrier 2007]. Van DOOREN, B., Rapport Van Dooren : Bibliothques universitaires et nouvelles technologies, Juin 1999. <http://www.education.gouv.fr/cid1927/bibliotheques-universitaires-et-nouvellestechnologies.html> [fvrier 2007]. OKRET-MANVILLE, C., Le dveloppement du numrique : un facteur dintgration des bibliothques dans les tablissements denseignement suprieur , in Chartron, G. (dir.), Les chercheurs et la documentation numrique : nouveaux services et usages, Paris, ditions du Cercle de la librairie, 2001, 268 p. PERNOO-BECCACHE, M., Lmergence des tudes littraires franaises sur Internet , Chartron, G. (dir.), Les chercheurs et la documentation numrique : nouveaux services et usages, Paris, ditions du Cercle de la librairie, 2001, 268 p. PROL-ISAACSON, D., LAMY-FAURE, C., SABATIER, I., Entre tradition et innovation : les pratiques documentaires des chercheurs en conomie gestion , Chartron, G. (dir.), Les chercheurs et la documentation numrique : nouveaux services et usages, Paris, ditions du Cercle de la librairie, 2001. 268 p. POLITY, Y., CARTELLIER, D., Les diteurs franais ou francophones et le Web , Bulletin des bibliothques de France, 2001, n1, p. 24-31, <http://bbf.enssib.fr> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 283/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

SALAN, J.-M., (dir.)., conomie et bibliothques, Paris, ditions du Cercle de la librairie, 1997, 234 p. SALAN, J.-M., MUET, F., Stratgie marketing des services dinformation, Paris, ditions du Cercle de la librairie, 2001, 221p. SANVILLE, T.-J., Use of electronic journals of OhioLINKs electronic journal centre , <http://www.ifla.org/IV/ifla67/papers/118-141e.pdf> [fvrier 2007]. WALFORD, L., Full Text services: The view of a publisher , Serials, vol. 11, n1, 1998, p.19-22.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 284/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Patrimoine et numrisation : la mise en contexte du document


Isabelle WESTEEL Bibliothque municipale de Lille

Le texte de lappel communications du colloque comporte un paragraphe probablement destin faire ragir les historiens du livre : Les historiens du livre ne se sont pas assez intresss la dure de vie relative des livres imprims de lpoque artisanale, la notion de nouveaut, de rafrachissement, aux formes nouvelles sous lesquelles les documents imprims traversent le temps, proccups quils taient par les problmes de production et didentification dateliers typographiques. Autre sujet dinterrogation pour les historiens : le numrique redonne vie des documents oublis ou renouvelle les modalits de lecture et dinterprtation de documents connus modifiant la relation traditionnelle aux corpus dont les dimensions temporelles doivent tre explicitement prises en compte 220 . Accepter totalement la premire partie de cette affirmation sans doute provocatrice dessein reviendrait nier les avances de la recherche en histoire du livre et les tudes de bibliographie matrielle des dernires dcennies. On peut par contre adhrer la deuxime partie de la dclaration qui pose la question de la vie nouvelle donne aux documents anciens par les techniques du numrique et qui invite les concepteurs et chefs de projet rflchir aux rgles de construction des bibliothques numriques patrimoniales. Hormis les grands corpus numriss comme Gallica <http://gallica.bnf.fr/> ou lAmerican Memory <http://memory.loc.gov/>, il faut avouer que la mise en ligne et la diffusion du patrimoine crit sur la Toile aboutissent pour le moment laffichage dun tout petit nombre dexemplaires anciens issus de la production imprime dAncien Rgime et risquent de mettre en lumire des auteurs et des ditions quelquefois choisis surtout pour leur adaptation la numrisation (louvrage est de petit format, il souvre facilement, on ne risque pas de trop casser la reliure en le manipulant, il est reprsentatif dune collection locale, il sera du plus bel effet sur le site-vitrine de la bibliothque), et non pour leur rle dans lhistoire de la production imprime, mettant ainsi de ct la dimension essentielle des corpus qui permet dtablir des comparaisons et de montrer des volutions dans le temps. En outre, la connaissance ou lignorance des rgles de rfrencement dans les moteurs de recherche par les professionnels de la documentation font que certains titres numriss apparatront ou non dans les listes de rsultats et accentuent encore cet effet de loupe.
220.

<http://www.ebsi.umontreal.ca/rech/ebsi-enssib/ebsi-enssib-programme.html> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 285/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Dautre part, alors qu lheure actuelle la plupart des documents du patrimoine crit sont mis en ligne en mode image de faon assez brute , il existe cependant des moyens techniques permettant de les situer dans un contexte bibliographique mais aussi historique, conomique ou sociologique Associs des outils de gestion de documents, les DTD et schmas XML offrent des possibilits de saisie et dindexation dun grand nombre dinformations et par consquent daffichages varis en fonction des publics et des usages. En effet puisque le patrimoine au sens dhritage commun et de proprit collective 221 est le bien de tous les publics, tous lgitimes pour se lapproprier, il faut donc que les bibliothcaires pensent usages et publics ds la conception des projets de mise en ligne. Il ne sagit pas de dgrader un affichage dinformations destines au chercheur en une version allge pour le grand public mais plutt de penser utilisateur ds le dbut du projet et plus encore, non pas seulement de rpondre une demande existante mais dinventer et de proposer de nouveaux modes de lecture. Lentreprise est difficile et comme une gageure : Comment reprsenter le rel et ce qu'il supposait de hirarchies tablies ds le premier contact, travers la formalisation segmente et relationnelle impose par sa numrisation 222 ? Aprs un rappel trs rapide de ltat des recherches en bibliographie matrielle ou analytique , seront exposes quelques possibilits informatiques qui pourraient permettre de mieux transmettre les rsultats de la recherche mene depuis plusieurs annes sur la contextualit du document en les mettant en ligne, bref de retranscrire le travail du bibliographe dans les bibliothques virtuelles . Un cas concret sera rapidement prsent partir du fonds du XIXe sicle conserv la Bibliothque municipale de Lille. Rappelons enfin brivement que limportance de la conservation et de la valorisation de limmense richesse du patrimoine culturel et scientifique europen par la numrisation a t mise en vidence dans les principes dfinis la Confrence de Lund, par le Rapport Minerva 223 et plus rcemment encore par la Charte de Parme 224 du 19 novembre 2003.
221. 222.

Frdric Barbier Patrimoine, production, reproduction , BBF, 2004, n 5, p. 11-20, <http://bbf.enssib.fr> [fvrier 2007]. Dominique Arot, La bibliothque numrique patrimoniale : paradoxes, missions, typologie et valuation , dans Bibliothques numriques, cours INRIA, 9-13 octobre 2000, La Bresse, Paris, ADBS ditions, p. 11-51 (Collection Sciences de l'information, srie tudes et techniques), ici p. 14. 223. <http://www.minervaeurope.org/> [fvrier 2007]. 224. <http://www.minervaeurope.org/structure/nrg/documents/charterparma031119final-f.htm> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 286/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

La recherche en histoire du livre

La bibliographie matrielle

Depuis maintenant plusieurs dcennies, les historiens du livre sintressent la bibliographie matrielle 225 : tude matrielle des textes imprims (physical bibliography), science voisine de ce quest la codicologie pour les manuscrits. Ltude pionnire a t celle de Lucien Febvre et HenriJean Martin dans LApparition du livre en 1958 226 . En France, Roger Laufer 227 a aliment la rflexion par des tudes thoriques et par des analyses de cas particuliers dont ldition du Diable boteux dAlain-Ren Lesage qui permet de mesurer les consquences relles quentrane la thorie dans ltablissement de la version dun texte. Aprs ldition entre 1982 et 1986 de la somme monumentale et inpuisable Histoire de ldition franaise 228 , dautres travaux majeurs sur la mise en page et la mise en texte (layout) du manuscrit 229 dabord, du livre imprim ensuite ont t publis. Les tudes dHenri-Jean Martin 230 ont montr lancrage dans le rel et dans le temps du document avec ce que cela suppose de mises en relations complexes et hirarchises, dstructures ou organises. Plusieurs journes dtude organises par lInstitut dhistoire du livre partir de 2001 231 ont dvelopp la problmatique de la mise en livre : pratiques dcriture et de lecture. Plus rcemment encore, des ouvrages importants ont contribu ce mouvement : citons Les Trois Rvolutions du livre, catalogue de lexposition du muse des Arts et Mtiers, 8 octobre 20025 janvier 2003 232 ou le Dictionnaire encyclopdique du Livre 233 dont le 1 er volume a paru en 2002 qui intgrent parfaitement ces notions avec par exemple les dfinitions suivantes : architecture du livre , avant-texte , chapitre , codex , datation du livre imprim , droit, livre de .
225.

Introduction la bibliographie matrielle, Institut d'Histoire du Livre, <http://ihl.enssib.fr/siteihl.php?page=41> [fvrier 2007]. 226. Lucien Febvre, Henri-Jean Martin, LApparition du livre, 1re d., Paris, Albin Michel, 1958 (Collection Lvolution de lhumanit), 3e d., ibid., 1999. 227. Roger Laufer, d., Alain-Ren Lesage, Le Diable boiteux : texte de la deuxime dition avec les variantes de ldition originale et du remaniement de 1726 prcd dune tude de bibliographie matrielle, Paris, La Haye, Mouton, 1970. 228. Henri-Jean Martin, Roger Chartier, dir., Histoire de ldition franaise, Paris, Promodis, 1982-1986. 229. Henri-Jean Martin, Jean Vezin, dir., Mise en page, mise en texte du livre manuscrit, Paris, Promodis, ditions du Cercle de la librairie, 1990. 230. Henri-Jean Martin, La Naissance du livre moderne : mise en page et mise en texte du livre franais : XIVe-XVIIe sicles, Paris, ditions du Cercle de la librairie, 2000. 231. Gographies de la mise en page, Journe dtude, 10 mai 2001, Bibliothque municipale de Lyon. 232. Alain Mercier, dir., Les Trois Rvolutions du livre : catalogue de lexposition du muse des Arts et Mtiers, 8 octobre 2002-5 janvier 2003, Paris, Muse des arts et mtiers, Imprimerie nationale, 2002. 233. Pascal Fouch, Daniel Pchoin, Philippe Schuwer, dir., Dictionnaire encyclopdique du livre, [volume 1], Paris, ditions du Cercle de la Librairie, 2002. Henri-Jean Martin, Prface , p. XIII-XXVI. Alain Nave, art. architecture du livre , p.135-136. Wallace Kirsop, art. bibliographie matrielle , p. 275-276. Henri-Jean Martin, art. chapitre , p. 505-506. Jean Vezin, art. codex , p. 555-556. Denise Hillard, art. datation du livre imprim , p.716-718. Jean-Yves Mollier, art. droit, livre de , p. 820-824.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 287/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Les recherches ont mis en vidence le fait que la dfinition du sens participe la fois du contenu et de la forme, celle-ci tant la fois tablie par le projet de lauteur et de limprimeur/diteur 234 et par un contexte technique et conomique. Roger Chartier le rappelle dans la prface de lessai de Donald Francis McKenzie 235 sur la bibliographie matrielle : Pour sen tenir lcrit imprim, le format du livre, les dispositions de la mise en page, les modes de dcoupage du texte, les conventions typographiques, sont investis dune fonction expressive et portent la construction de la signification. Organiss par une intention, celle de lauteur ou de lditeur, ces dispositifs formels visent contraindre la rception, contrler linterprtation, qualifier le texte. Structurant linconscient de la lecture (ou de lcoute), ils sont les supports du travail de linterprtation . Dans la prface de La Naissance du livre moderne, Henri-Jean Martin 236 montre que les textes ne sont jamais dsincarns, lobjet-livre soffre pour en suggrer les diverses portes et son analyse est indispensable qui veut en comprendre la conception comme la rception. En tudiant la structure du livre au sens large, la bibliographie matrielle se met au service dautres branches du savoir comme lhistoire, lhistoire littraire, lhistoire des ides Dans le contexte numrique qui nous occupe, il y a grand intrt relire l'essai de D.F. McKenzie 237 qui dfinit la bibliographie comme une sociologie des textes, comme la discipline qui tudie les textes en tant que formes conserves, ainsi que leurs processus de transmission, de la production la rception , capable de restituer la prsence humaine au sein de tous les textes fixs et enregistrs. Dans la prface 238 de lessai, Roger Chartier prcise que dans son effort pour refonder la bibliographie, D.F. McKenzie cartographie, en fait, un espace intellectuel nouveau qui articule ltude des textes, lanalyse de leurs formes et lhistoire de leurs usages. Les termes utiliss de texte, forme et usage ne sont pas sans rappeler ceux de signe (comme un porteur de sens), de forme (comme un objet matriel ou immatriel) et de mdium (comme un vecteur de communication) chers Roger T. Pdauque 239 . La bibliographie matrielle a dj mis en place des mthodologies quil faut certes nourrir et reprendre mais quil serait dommage doublier dans les discussions autour du document numrique.
234.

Un exemple frappant de la place de limprimeur est donn par les crits et les compositions ou les improvisations typographiques de Restif de la Bretonne qui est venu la littrature par la typographie Non seulement il pense en termes dimprimerie mais il crit typographie comme on parle anglais . Philippe Dubois, Litalique et la ruse de loblique : le tour et le dtour , Lespace et la lettre : critures, typographies, Cahiers Jussieu n 3, 1977, Universit Paris 7, Paris, UGE (10-18), p. 243-256, ici p. 244. 235. Donald Francis McKenzie, La Bibliographie et la Sociologie des textes, prface de Roger Chartier, Paris, ditions du Cercle de la Librairie, 1991, p. 6. 236. Henri-Jean Martin, La Naissance du livre moderne Introduction, p. 3. 237. Donald Francis McKenzie, op. cit., p. 30, 54. 238. Donald Francis McKenzie, op. cit., p. 11. 239. RTP, Document : forme, signe et relation, les re-formulations du numrique, d. RTP STIC-CNRS [pseudonyme Roger T. Pdauque], 2003, <http://archivesic.ccsd.cnrs.fr/sic_00000413.html> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 288/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Quelques orientations de la recherche en histoire du livre

Dans la trilogie contenu/contenant/contexte, les orientations actuelles de la recherche en histoire du livre vont plutt vers le troisime volet. Lune des tudes majeures de ces derniers mois a paru en 2002 dans le Bulletin du bibliophile. Dans un article intitul Entre bibliographie et catalographie : de ldition lexemplaire , Edoardo Barbieri 240 nonce le concept d histoire de lexemplaire qui ne se limitera pas au relev et lidentification des traces , mais lenqute ira jusqu leur description et linterprtation de leur signification . En outre lhistoire de lexemplaire pourra faire appel des sources autres que les marks, par exemple des documents indpendants de lexemplaire : lments de bibliographie matrielle et sources darchives (archives judiciaires, dditeurs). Cette tude est illustre dun schma permettant dentrevoir les croisements et les entrelacements entre les lments lis lhistoire ditoriale, ceux relevant des marks in books et ceux constitutifs de lhistoire de lexemplaire. Ces relations permettent de constituer un vritable dossier autour du document tudi. E. Barbieri en donne un exemple avec ldition princeps du Nuovo Testamento traduit en italien par Antonio Brucioli et publi Venise en 1530 par Lucantonio Giunta 241 . La dcouverte et ltude prcise dexemplaires redcouverts ont permis de reconstituer lhistoire de ldition. Pour le moment il est difficile dintgrer ces reconstitutions, ces dcouvertes et ces rsultats dans les catalogues informatiques. Plusieurs tudes croises en histoire du livre et en histoire de lart 242 deux disciplines qui auraient encore intrt se rapprocher ont montr limportance des relations entre texte et illustration. Michel Melot 243 crit : [] le problme se pose de traiter lillustration par rapport au milieu qui la dfinit en creux : lcriture, non en terme de traduction ou de transposition mais en terme de complmentarit et de concurrence. Pour cela, il fallait que lon pt penser lun et lautre systme au sein dune mme thorie. Or, il ny a pas si longtemps que la smiologie existe. [] Limage nest plus lappendice, lornement ou la redondance dun texte. Elle est une technique diffrente dapprhension de la connaissance . Plusieurs tudes sur lillustration du livre scientifique au
XVI
e

sicle clairent remarquablement cette place particulire quoccupe

lillustration dans la mise en page. Lintgration verticale de certains animaux (le rhinocros, le porc-pic, llphant) des Historiae animalium (1551) de Conrad Gesner montre la place et
240.

Edoardo Barbieri, Entre bibliographie et catalographie : de ldition lexemplaire , Bulletin du bibliophile, n 2 (2002), p. 241-268, ici p. 245, 248, 256. Voir aussi Edoardo Barbieri, Postille in bibliotheca, <http://eprints.rclis.org/archive/00000768/01/PostillatiBARBIERI.pdf> [fvrier 2007]. 241. Edoardo Barbieri, Le Bibbie italiane del Quattrocento e del Cinquecento. Storia e bibliografia raggionata delle edizioni in lingua italiana dal 1471 al 1600, Milan, 1992, n 21. Bibles imprimes du XVe au XVIIIe sicle conserves Paris, d. Martine Delaveau et Denise Hillard, Paris, Bibliothque nationale de France, 2003, n4345. 242. Textes imprims et images : XVIe-XXe sicle, tudes runies par Annie Charon, Isabelle Diu et Elisabeth Parinet, Bibliothque de l'cole des chartes, t. 158, janvier-juin 2000. 243. Michel Melot, LIllustration : histoire dun art, Paris, Skira, 1984, p. 13.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 289/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

limportance des illustrations dans les sommes et encyclopdies scientifiques de la Renaissance. La centralit des images nempche pas un travail de mise en page normalise 244 . Depuis, le clbre rhinocros parcourt quelquefois la Toile sortie de tout contexte. De la mme faon, les images clbres du De Humani corporis fabrica (Ble, 1re d. 1543, dessins de Stephan van Calcar, 2e d. 1555) du mdecin bruxellois Andr Vsale ne sont pas seulement les tmoignages dune maturit des pratiques dobservations de la science anatomique mais participent dun code prcis de mise en page. Les ouvrages de cosmographie sont galement un excellent terrain d'tude en la matire. Enfin, la question de la temporalit lie la rception dun ouvrage, cest--dire la priode pendant laquelle un document (un livre) reste dactualit commence tre aborde. Lhistoire des rditions pourrait tre approfondie 245 . Laurent Pinon 246 le suggre dans son tude sur les livres de zoologie. Ce sont bien les tudes autour de corpus associes aux analyses monographiques qui permettent dtablir des filiations, des tendances. Or, on constate que la mise en ligne des textes et des images sur le Web par lintermdiaire de bibliothques numriques ou de sites patrimoniaux peut aboutir une profusion, une dispersion, mais aussi une segmentation et finalement une dsincarnation du document.
Les besoins des chercheurs

Les bibliothques ont dj beaucoup travaill et avanc par la constitution des catalogues collectifs en ligne 247 . Par ces nouveaux outils, la recherche bibliographique sest considrablement amliore profitant des avantages de laccs linformation par les rseaux : accs dmultiplis et par consquent facilits pour reprer, localiser et mme parfois identifier un document. Cest ce dernier point lidentification qui pose souvent problme. Les notices bibliographiques de livres anciens sont souvent incompltes et lapplication des normes et rgles de catalogage varie entre catalogues et entre pays. Il est souvent difficile de saisir et donc dinterroger la richesse des donnes dexemplaires et on peut regretter le manque de normalisation dans ce domaine prcis malgr les efforts faits dans certains catalogues, par exemple dans le Sudoc (Systme universitaire de documentation) en France. Les possibilits nouvelles lies au numrique pourraient justifier une
244.

Jean-Marc Chatelain, Laurent Pinon, Genres et fonctions de lillustration au XVIe sicle , dans Henri-Jean Martin, La Naissance du livre moderne : mise en page et mise en texte du livre franais : XIVe-XVIIe sicles, Paris, ditions du Cercle de la librairie, 2000 p. 236-269, ici p. 257-258. 245. Dans les catalogues informatiss, les recherches par date sont souvent difficiles et/ou les listes de rsultats incompltes en raison de la compltude des donnes saisies. 246. Laurent Pinon, Livres de zoologie de la Renaissance : une anthologie : 1450-1700, Paris, Klincksieck, 1995. (Corpus iconographique de lhistoire du livre). 247. Henri-Jean Martin, Bibliothques , dans Encyclopaedia universalis, 2002, corpus, 4, col. 68-74, ici col. 73.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 290/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

redfinition de certaines rgles de catalogage et un travail sur la normalisation des mtadonnes 248 lies aux documents patrimoniaux. Dans la conclusion de sa communication la journe CERL de Chantilly en mai 2004, Dominique Varry 249 prsentait un cahier de dolances tout fait lgitime : Comment amliorer les conditions dinterrogation et dexportation des notices ? Comment corriger des notices manifestement fautives, et amliorer la qualit gnrale de linformation bibliographique ? Comment tenir compte des rsultats des travaux des bibliographes ? Les deux premires dolances portent principalement sur les questions dindexation et de points daccs. De nombreux catalogues collectifs comprenant des notices de livres anciens ont t constitus la suite de programmes importants de rtroconversion ou conversion rtrospective ou autrement dit de saisie informatise des donnes se trouvant dans les catalogues papier imprims ou sur fiches. Mme si de nombreuses vrifications ont pu tre faites livres en main, ces programmes denvergure ont soit repris telles quelles les informations inscrites sur les anciens catalogues, soit ont procd des drivations partir de rservoirs bibliographiques composites. Or pour offrir aux chercheurs et au public en gnral des possibilits de recherche efficaces, il faut que les informations saisies soient bien sr indexes et mieux encore normalises, ce qui tait loin dtre le cas pour les fiches catalographiques tablies au
XIX
e

sicle ou au dbut du

XX

sicle mme si au cours du sicle la

normalisation progressa assez rapidement. Pire quand lindication sur le catalogue papier est errone par exemple pour une date il est possible que lerreur soit reproduite dans lenregistrement informatique et cela peut aboutir la prsence dans les catalogues informatiss dditions nayant jamais exist. Ce risque est toujours possible malgr les systmes de contrle mis en place loccasion des programmes de rtroconversion. La troisime dolance franchit une tape supplmentaire en demandant linscription dans les catalogues des rsultats de la recherche en bibliographie matrielle savoir dans les cas les plus simples : correction de dates, de graphies et dans des cas plus complexes : rattribution douvrages des auteurs ou des diteurs. Sans vouloir nier les extraordinaires avances amenes par lInternet dans le domaine patrimonial, le contrle prcis de chaque exemplaire et le recours des informations complmentaires restent ncessaires aprs la consultation des catalogues. Une interrogation tout fait russie ne peut dpendre que de la richesse des mtadonnes saisies et affiches.

248.

lisabeth Coulouma, Le Signalement des livres anciens dans le Sudoc , journe dtude Le livre ancien : patrimoine franais, patrimoine europen, Chantilly, Maison de Sylvie, 15 mai 2004. 249. Dominique Varry, Le Bibliographe dix-huitimiste et les ressources catalographiques franaises sur support lectronique , journe dtude Le livre ancien : patrimoine franais, patrimoine europen, Chantilly, Maison de Sylvie, 15 mai 2004, diapo 150. <http://www.enssib.fr/imprimer.php?type=news&id=325> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 291/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Le livre ancien sur Internet

Les catalogues

Dans le catalogage du livre ancien, aprs une saisie normalise des donnes de ldition, la richesse de linformation tient aux donnes dexemplaires qui permettent den reconstituer lhistoire. Pour le livre contemporain chaque exemplaire localis offre simplement une possibilit supplmentaire daccder au texte ; pour le livre ancien la localisation elle-mme est une donne significative cause des lments matriels lis lexemplaire et qui, insignifiants quand on les considre unit par unit, sont clairs par un traitement en srie 250 . Le catalogage livre en main permet de relever les informations suivantes : transcription exacte de la page de titre, variantes de titre, collation, pices liminaires, filigrane et papier, ornements typographiques, mentions dexemplaires Trs peu de catalogues en ligne de bibliothques proposent ces informations, essentiellement pour des questions de cots. Les fiches du catalogue de lIstituto Centrale per il Catalogo Unico (ICCU) 251 des bibliothques italiennes comportent des champs de notes diffrencis pour certaines informations (contenu prcis, empreinte, police de caractres). Encore en Italie, le catalogue des incunables avec apostilles de la Trivulziana 252 permet de consulter des fiches particulirement prcises avec mise en ligne sous mode image des parties comportant des annotations et notes marginales et transcription sur le mme cran.
Des outils complmentaires

Mme si les exemplaires sont dcrits le plus prcisment possible et que les informations sont saisies de faon standardise ou normalise, il est quelquefois impossible de se passer de limage pour procder aux identifications, cest le cas notamment pour les ex-libris et lornementation typographique. Un exemple choisi dans le fonds de la Rserve commune des trois universits lilloises (Lille 1, Lille 2, Lille 3) montre que souvent lidentification prcise dun ex-libris ncessite une consultation de visu sur place ou distance. Le cas prsent ici concerne des exemplaires provenant de la bibliothque de la famille dArenberg. Comment dcrire les deux ex-libris prsents cidessous sans aucune ambigut ? Pouvoir consulter limage permet de croiser cette information avec
250.

Franois Dupuigrenet Desroussilles, Note sur laccs aux catalogues sur support lectronique des collections de livres anciens conservs en France prsente la journe dtude Le livre ancien : patrimoine franais, patrimoine europen, Chantilly, Maison de Sylvie, 15 mai 2004. 251. <http://opac.sbn.it/> [fvrier 2007]. 252. <http://www.marginalia.it/> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 292/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

des registres, des inventaires ou des catalogues de bibliothques, dtablir des comparaisons avec dautres ex-libris reprs et ainsi de progresser dans lhistoire de lexemplaire .

Ex-libris Arenberg. Rserve commune des universits Lille 1, Lille 2, Lille 3. Universit Lille 3.

Plusieurs outils didentification sont ainsi proposs en ligne : les bases dex-libris et les banques de donnes consacres lornementation typographique. Ainsi la bibliothque municipale de Lyon a cr la base Provenance qui met en ligne les images des reliures armories, des ex-libris imprims ou manuscrits ou encore des notes marginales associes des fiches descriptives trs prcises 253 . La mise en ligne de ces marques 254 permet de reconstituer litinraire intellectuel et gographique des ouvrages et contribue pleinement aux recherches en histoire du livre. Par ailleurs, plusieurs banques de donnes offrent de nouvelles possibilits dtude de lornementation typographique en prsentant des corpus en ligne : la banque de donnes dornements dimprimerie Passe-Partout 255 , le programme
253.

<http://sged.bm-lyon.fr/Edip.BML/(k2w5dg45ythnqh55zsezerrc)/Pages/Redirector.aspx?Page=MainFrame > [fvrier 2007]. 254. Dans larticle cit plus haut, Edoardo Barbieri (pp. 242-244) tudie avec prcision le terme mark qui ne correspond pas exactement au terme franais marque . 255. <http://www2.unil.ch/BCUTodai/app/todaiGetIntro.do?uri=todaiInfo&page=todaiIntro.html> [fvrier 2007]. Silvio Corsini, Vers un Corpus des ornements typographiques lausannois du XVIIIe sicle. Problmes de dfinition et de mthode , dans Ornementation typographique et bibliographie historique : actes du colloque de Mons 26-28 aot 1987 dits par Marie-Thrse Isaac, Mons, Bruxelles, 1988, p. 139-165.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 293/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Mrine 256 (soutenu par le Fonds National Belge de la Recherche Scientifique) qui concerne l'ensemble de la production europenne des Lumires, principalement en Belgique, en France et aux Pays-Bas. Cette banque se veut aussi un outil collaboratif, en proposant une rubrique de questions/rponses finalement assez peu utilise. Ces diffrents outils peinent cependant intgrer les rsultats dune recherche plus traditionnelle 257 . Un corpus de marques dimprimeurs est galement prsent sur le site de la Bibliothque de l'Universit de Barcelone 258 .
Le livre ancien mis en contexte

Des essais de mises en contexte de documents anciens sont proposs par quelques bibliothques numriques patrimoniales. Mais, tout dabord, au-del de son ct conomiquement intressant, rappelons que la numrisation en mode image permet de conserver la mise en page de louvrage original et constitue un atout majeur pour les tudes de bibliographie matrielle. On oublie malheureusement quelquefois de mentionner les dimensions physiques des documents par une chelle de mesure associe limage numrise et pire encore de numriser les parties liminaires de louvrage empchant ainsi les historiens du livre daccder certaines informations concernant lexemplaire (marques de provenance, notations manuscrites). En France, plusieurs sites mettent en ligne des livres anciens en prcisant le contexte par des fiches explicatives accessibles par un hyperlien depuis la notice du document numris. Citons : Bibliothques Virtuelles Humanistes 259 , Tours ; CNUM, Conservatoire National des Arts et Mtiers 260 , Paris ; Medic@ 261 , Bibliothque interuniversitaire de mdecine de Paris ; Plib 262 , Ple Universitaire europen Lille-Nord-Pas-de-Calais Deux expriences lune anglaise, lautre canadienne rcentes peuvent tre mentionnes car elles ajoutent des outils supplmentaires aux sites cits ci-dessus. Ainsi, depuis quelque temps, un site web de la British Library prsente quatre-vingt-treize exemplaires numriss de pices de thtre de Shakespeare 263 (format in 4) dans les ditions les plus anciennes, avec possibilits de feuilleter les exemplaires sparment ou de comparer deux copies sur un seul cran, mthode prcieuse dans le cadre dtudes en bibliographie matrielle . Outre-Atlantique, lUniversit de Victoria (British Colombia, Canada) prsente en ligne le fac-simil dune dition du XVIe sicle, du
256. 257.

<http://www.ulg.ac.be/moriane/> [fvrier 2007]. Daniel Droixhe, Elle me cote dix mille cus. La contrefaon des uvres de Molire offerte par limprimeur Bassompierre Marmontel , Revue franaise dhistoire du livre, n114-115, 2002, p. 125-159. Franoise Weil, Enqute sur les imprimeurs parisiens de la premire moiti du XVIIIe sicle : lenseignement des ornements et des pratiques typographiques , Revue franaise dhistoire du livre, n114-115, 2002, p. 165-180. 258. <http://eclipsi.bib.ub.es/imp/impeng.htm> [fvrier 2007]. 259. <http://www.bvh.univ-tours.fr/> [fvrier 2007]. 260. <http://cnum.cnam.fr/> [fvrier 2007]. 261. <http://www.bium.univ-paris5.fr/histmed/medica.htm> [fvrier 2007]. 262. <http://polib.poleuniv-lille-npdc.fr/> [fvrier 2007]. 263. <http://www.bl.uk/treasures/shakespeare/homepage.html> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 294/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Sancti Patris Nostri Epiphanii, Episcopi Constantiae Cypri, ad Physiologum dit par Consalus Ponce de Leon chez Christophe Plantin Anvers en 1588 264 . Le site prsent est trs complet sur lhistoire de ldition et sera rgulirement complt et mis jour avec les informations donnes par les chercheurs.

Perspectives : Prendre en compte les usages Les bibliothques numriques patrimoniales doivent-elles ou peuvent-elles intgrer les besoins des chercheurs et les approches savantes par une mise en contexte amliore des ressources numrises ? Comment retranscrire les changes textes/images, les rapports ditions/exemplaires et la trilogie contenu/contenant/contexte ? Que devient ltude matrielle (codicologique), culturelle et sociologique du document ? Le patrimoine tant affaire de tous, comment concilier approche rudite et vulgarisation ? Comment laborer un modle qui permettrait de saisir au sein dun seul document un ensemble complet dinformations (description bibliographique, description de lexemplaire, fichiers dautorits, champs de liens et texte libre) et de les dcliner ensuite en fonction des usages ?
Les possibilits de lencodage DTD / XML

Les perspectives offertes depuis quelques annes par les langages de balises : SGML, puis XML laissent entrevoir des possibilits de prendre en compte la fois les besoins des chercheurs en histoire du livre, les savoir-faire des bibliothcaires et les attentes et/ou demandes des usagers. Des essais faits autour de plusieurs DTD : la TEI, lEAD et des formats bibliographiques XML montrent que ces outils peuvent tre pris en compte dans les projets.
La TEI

La TEI (Text Encoding Initiative) 265 , cre en 1987, utilise un ensemble trs complexe de balises permettant de traiter de faon informatique des textes de tous genres : prose, posie, thtre Un document conforme la TEI contient dune part un en-tte <teiHeader>, assez comparable une fiche de catalogue, qui comporte les informations gnrales sur le document et dautre part la transcription du texte introduite par llment <text>. Driv de la TEI qui permet une dition trs riche, le projet MASTER (Manuscript Access through Standards for Electronic Records) a t conu pour lencodage des manuscrits. Nous reprenons ici les rsultats dune tude publie en 2001 par Anne Mette Hansen de lUniversit de Copenhague sur lencodage des livres
264. 265.

<http://gateway.uvic.ca/spcoll/physiologum/> [fvrier 2007]. <http://www.tei-c.org/> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 295/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

de prires danois. Lexprience entend faire ldition des textes en tenant compte de leur nature et de leur fonction sociale. Dans le rsum de ltude, Elisabeth Lalou, chercheur lI.R.H.T. (Institut de Recherche et dHistoire des Textes, laboratoire CNRS) numre dabord les diffrentes disciplines concernes par lencodage des textes. Son analyse rejoint les avances de la bibliographie nonces plus haut : Lencodage des textes est une nouvelle approche philologique qui combine plusieurs disciplines : la critique littraire (texte et mots dans leur contexte), la rhtorique (structure du texte, langue et versification), la linguistique (morphologie et syntaxe), critique textuelle (corrections et normalisation), palographie (analyse de lcriture), codicologie (mise en page et description de lobjet-manuscrit) et lhistoire de lart. Plusieurs balises sont utilises pour marquer les diffrents aspects de louvrage : transcription, codicologie, structure 266 Les balises codicologiques utilises sont : cahiers <qb/>, pages <pb/> et ruptures de lignes <lb/>. Pour structurer le contenu intellectuel, les diffrentes parties du texte sont marques par des balises dclinantes <div> comme <div type="psalter">, <div type="prayer"> Autre point important et nous y reviendrons : les noms de personnes sont identifis et on leur met une clef attribut avec un code se rfrant un fichier bibliographique des noms de personne fabriqu part : <name type="person" reg="Maren Jespersdatter" key ="MarJes01">. Cette faon dencoder les informations permet de rendre compte du contexte de naissance et de diffusion du manuscrit.
LEAD

La DTD EAD (Encoded Archival Description) 267 , autre format cr avec XML, soutenue par la Socit des Archivistes Amricains (SAA) est un modle particulirement adapt aux instruments de recherche archivistiques car elle permet de reprsenter tous les lments dinformation dfinis dans lISAD (G) (General International Standard Archival Description), norme de description archivistique publie en 1994. La DTD EAD est galement utilise dans les bibliothques pour la structuration des catalogues de manuscrits. LEAD a t retenue pour lencodage du CGM en France (Catalogue gnral des manuscrits des bibliothques publiques de France). Son utilisation est galement possible pour dcrire certaines collections iconographiques en particulier quand celles-ci font partie dun fonds prcis. Dans le but dinscrire les documents dans un contexte, notons que lEAD permet de grer un document complet, avec liens vers des images numrises internes ou externes (lments <dao> et
266.

Anne Mette Hansen, Text encoding of manuscripts : private devotional literature in the 16th century., 2002, <http://lemo.irht.cnrs.fr/41/mo41_09.htm>, [fvrier 2007]. lisabeth Lalou, [Rsum abrg du texte], LApport cognitif, Le Mdiviste et lOrdinateur, n41, hiver 2002, <http://lemo.irht.cnrs.fr/41/mo41_09_resume.htm> [fvrier 2007]. 267. <http://www.loc.gov/ead/> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 296/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

<extref>). Le balisage smantique ou indexation dans le texte est possible dans lEAD par lintroduction dlments <persname>, <geogname>, <corpname> ou encore <famname> dans le texte, rservant la possibilit dintroduire la notion dautorit dans du texte libre 268 , ce que ne permettent pas les formats MARC. Le lien vers un fichier dautorit peut se faire ensuite par un numro didentification (par exemple vers la liste dautorits RAMEAU maintenue par la Bibliothque nationale de France), procd assez classique dans la pratique des bibliothques habitues grer les donnes des fichiers et listes dautorits, condition bien sr que loutil de gestion des documents le permette. Enfin toujours dans ce mme souci de contextualisation , llment <add> (Donnes descriptives additionnelles) offre des possibilits daccs supplmentaires par des index, des bibliographies En 1998 a t conue la DTD XML EAC 269 (Encoded Archival Context), qui permet de structurer linformation habituellement place dans llment <bioghist> de lEAD, qui correspond llment biographie/histoire administrative dISAD (G) et donc dindexer des notices dautorits (informations normes, texte libre, systmes de liens). Le projet europen LEAF 270 (Linking and Exploring Authority Files = Relier et explorer les fichiers dautorits) destin tablir un serveur central de notices dautorits en direction de diverses institutions culturelles (bibliothques, services darchives, muses) a dcid dutiliser lEAC comme format de stockage des notices dautorits.
tude de cas

Riche de plus de 500 000 volumes, la bibliothque municipale de Lille possde un fonds local et rgional de tout premier plan, qui comprend entre autres une collection trs riche dditions lilloises . Ces ouvrages sont consults par les Lillois, par les historiens, par les spcialistes de lhistoire de ldition du
XIX
e

sicle et du dbut du

XX

sicle Les ditions

lilloises ont connu une priode faste dans la deuxime moiti du XIXe sicle, comme dans dautres grandes capitales rgionales, avec la publication en nombre important douvrages difiants et moralisants destins lducation. Cest de ce fonds trs riche que nous avons choisi dextraire quelques ouvrages pour illustrer les ides de Dossier et de Contexte dont il a t fait mention plus haut. Le choix sest port sur un ouvrage reprsentatif de ce courant ddition religieuse de la deuxime moiti du
268.

XIX

sicle. Il sagit dun best-seller de lpoque, rdit

Florence Clavaud, Martin Svigny, Instruments de recherche : La mise en uvre des nouvelles technologies , dans Abrg darchivistique : principes et pratiques du mtier darchiviste, Paris, Association des archivistes franais, 2004, p. 159-188, ici p. 166. Forence Clavaud, Guide EAD du CHAN : Indexation de linstrument de recherche : Comment indexer un document EAD, 2004. <http://www.archivesnationales.culture.gouv.fr/chan/chan/infopro/fr/indexation/modalites/dansouhorsletexte.html> [fvrier 2007]. 269. <http://jefferson.village.virginia.edu/eac/> [fvrier 2007]. 270. Projet LEAF version franaise : <http://www.crxnet.com/leaf/french/index.html> [avril 2005].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 297/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

plusieurs reprises, prsentant le rcit difiant de la vie et du martyre du comte de Flandre, Charles le Bon, assassin dans la cathdrale Saint-Donatien de Bruges en 1127. Louvrage est crit par Mathilde Bourdon, auteur de plusieurs dizaines douvrages dducation religieuse et publi en 1853.

Illustration 1 [cote 21968]

Bourdon, M., Charles le Bon, comte de Flandre [suivi de Pharalde tradition de la Flandre. Rgine] par lauteur de St. Martin, vque de Tours [Mathilde Bourdon], Lille : L. Lefort, 1853. 216 p., front. ; 15 cm. Lit. de F. Robaut Douai. Bibliothque municipale de Lille [21968]

Louvrage est ensuite rdit. Citons un exemplaire de prparation une nouvelle dition datant de 1909 et prsentant en particulier des essais dillustrations plus dans le got de lpoque.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 298/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Illustration 2 [cote 19416]

Bourdon (Mathilde). Charles le Bon, comte de Flandre. Madame Bourdon, 4e d., Paris ; Lille, Taffin J. Lefort, 1909. 142 p. ; 22 cm. Don Taffin Exemplaire de prparation une nouvelle dition. Bibliothque municipale de Lille [19416]

Les collections de la bibliothque municipale contiennent dautres ouvrages de la mme poque abordant le mme thme : Lille en 1884 par la Socit de Saint Augustin.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 299/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Illustration 3 [cote : 24809]

Edward Le Glay Histoire du bienheureux Charles le Bon, comte de Flandre par Edward Le Glay. Lille : Socit de Saint-Augustin ; Descle de Brouwer, 1884. 332 p. 24 cm. (Bibliothque des Familles Histoire). Bibliothque municipale de Lille [24809]

Lensemble de ces ditions peuvent tre regroupes dans un Dossier dit Charles le Bon . On pourrait constituer un autre Dossier dit Lefort comprenant cette fois les ditions de la maison Lefort qui ont la particularit parfois dtre recouvertes de magnifiques cartonnages dditeurs. Dans un souci dappropriation du patrimoine par le plus grand nombre, il serait intressant de pouvoir offrir au public bien plus que laffichage difficile et parfois obscur dune notice bibliographique conforme aux normes de catalogage. Laffichage de dossiers thmatiques (Dossier Lefort par exemple) et de lignes explicatives abordant le contexte de publication, de rception et dinterprtation des ouvrages prsents serait une faon dentrer dans ce mouvement de patrimonialisation quentrane lintroduction du numrique dans les bibliothques et de rendre ce pass conserv dans les bibliothques au citoyen.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 300/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

L'encodage ci-dessous a t ralis avec la DTD BiblioML 271 , application XML compatible avec le format (UNI)MARC. Outre la prise en compte d'informations que les formats Marc peinent intgrer : table des matires, illustrations, texte intgral le balisage smantique de llment <notes> par les lments <persname> et <geogname> permet de concilier la rdaction dun texte libre sur le contexte de louvrage et la normalisation de la saisie de certains noms propres, ce qui devrait laisser la possibilit aux outils de gestion des ressources de faire des liens vers des listes ou des fichiers dautorits. Les lments <Relationships> et <LinkedItem> permettent de pointer vers la rdition de 1909, comme peuvent le faire les champs 4XX du format UNIMARC. Enfin, un hyperlien permet de pointer vers le site de la Bibliothque nationale de France qui offre limage dun manuscrit mettant en scne le meurtre de Charles le Bon dans lglise Saint-Donatien de Bruges.
<? xml version="1.0" encoding="UTF-8" ?> <BiblioRecord> <Notes> <Note>Imprimeur Lille depuis 1801, Lefort est spcialis dans la librairie religieuse d ducation et publie surtout de la littrature moralisante. partir de 1827, limprimerie vit du succs de sa collection vedette : la Nouvelle bibliothque catholique. <persname normal="Bourdon, Mathilde (1817-1888)" authfilenumber="FRBNF12118901" source="fichier-autorits-BnF">Mathilde

Bourdon</persname> est un auteur fcond de cette maison d'dition. La bibliothque municipale de Lille possde certains de ses romans moralisants : Si javais mille cus , Thodule : modle pour la jeunesse , relis dans de superbes cartonnages d'diteurs. </Note> <Note>Louvrage relate la vie de<persname normal="Charles (1083 ?-1127 ; comte de Flandre)" lglise authfilenumber="FRBNF145387588" Saint-Donatien de<geogname source="fichier-autorits-BnF"> normal="Bruges (Belgique)" Charles le Bon</persname> comte de Flandre et en particulier son assassinat dans authfilenumber="FRBNF119498740" France. <ElectronicLocation> http://www.bnf.fr/enluminures/manuscrits/man5/i1_0073.htm </ElectronicLocation> </Note>
BiblioML : <http://www.biblioml.org/> [avril 2005]. Cet essai d'encodage suit les spcifications de BiblioML avec quelques nuances, notamment pour l'lment <Notes>. Lessai aurait galement pu tre ralis avec dautres DTD ou schmas XML bibliographiques comme le Dublin Core. Je remercie Frdric Glorieux pour ses remarques.
271.

source="fichier-autorits-BnF">

Bruges</geogname> en 1127. Cet pisode est relat dans les Grandes Chroniques de

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 301/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

</Notes> <Relationships> <LinkedItem> <Title>Charles le Bon, comte de Flandre</Title> <Author>Madame Bourdon</Author> <EditionStatement>4e d. </EditionStatement> <Place>Paris ; Lille : Taffin-Lefort</Place> <Date> 1909</Date> </LinkedItem> </Relationships> </BiblioRecord>

Vers des espaces collaboratifs

Lidal serait encore de pouvoir disposer dinstruments de travail collaboratifs permettant plusieurs personnes et/ou institutions denrichir des notices distance. Grce aux outils dadministration proposs dans un environnement web, il est possible de rpartir la saisie et la mise en ligne de documents enrichis entre plusieurs tablissements dans le cadre dune rgion par exemple, cet chelon administratif paraissant adquat pour une mise en valeur partage dune mmoire commune. Dautres possibilits techniques existent pour mutualiser et redistribuer comptences et connaissances 272 . Plusieurs outils informatiques offrent la possibilit dorganiser des espaces dchanges et de collaboration, permettant de soutenir des politiques de coopration entre tablissements, par exemple dune part le protocole OAI-PMH et dautre part les systmes dannotations ou dindexation qui font leur apparition dans le contexte des bibliothques numriques patrimoniales. Le protocole de collecte de mtadonnes de lInitiative des archives ouvertes (OAI-PMH Open Archives Initiative Protocol for Metadata Harvesting) permet dagrger les mtadonnes des ressources patrimoniales dans un emplacement central tout en laissant les ressources sous la responsabilit de leur crateur (ltablissement culturel responsable) ou dun fournisseur de services spcialis capable den assurer la maintenance. Les tablissements peuvent donc maintenir une base
Les listes de discussion livre ancien existent peu en France. Au cours dune journe organise par les AANLA en 1999, Yann Sordet avait dress un tableau des listes de diffusion et forums de discussion autour de ce thme. La consultation des adresses web slectionnes montre que la plupart des listes nexistent plus. En France la liste Patrimoine ne remplit pas ce rle de veille autour de lhistoire du livre. La liste SHARP (Society for the History of Authorship, Reading & Publishing) rpond ce besoin dchanges entre chercheurs en histoire du livre. (SHARP-L : The Electronic Conference for the History of Print Culture avec des archives recherchables : <https://listserv.indiana.edu/> [fvrier 2007]. Dautre part, les collges invisibles fonctionnent trs bien pour la distribution de ces informations trs spcialises.
272.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 302/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

ou un site correspondant leurs propres besoins et permettre dautres tablissements de construire dautres systmes daccs leurs donnes 273 . Plusieurs sites intressants utilisent ce protocole, on peut citer en particulier le projet AIM25 274 (Kings College London, UK) qui propose un accs fdr grce au protocole OAI aux descriptions des fonds darchives et de manuscrits de plus de 50 tablissements (universits, coles et socits savantes de Londres). Le site propose un formulaire de recherche rapide et un formulaire de recherche avance, ainsi que des accs possibles aux index noms et sujets. Le rsultat est assez probant. Les systmes de collaborations en ligne et les possibilits d'annotations des documents sont galement amens se dvelopper. Ce type doutils est souvent demand par les chercheurs dans les bibliothques. Nous pouvons citer les travaux de recherche de lquipe Imadoc de lIrisa 275 et lexprimentation mene aux Archives dpartementales des Yvelines autour dun systme dannotations de documents. Ce programme cherche faciliter laccs aux documents darchives par le contenu manuscrit et pourrait permettre un systme de production dannotations la fois automatique : en utilisant les techniques de reconnaissance de formes, et collaboratif : en permettant aux usagers de produire leurs propres annotations sur les documents partir dune interface web. Cet outil simple dans son utilisation ouvre des perspectives pour llaboration de systmes dannotations partags sur un mme document. Rpondant ce mme souhait, le systme Porphyry 276 prsent La Rochelle en juin 2004 sadresse des communauts dexperts appels travailler sur des corpus documentaires numriss . Les bibliothques considres sont spcialises et destines des experts. Dans un tel cadre, limiter la description des documents une indexation, unique, fixe et effectue par un tiers, reviendrait nier lexpertise des lecteurs. Dans certains cas, il faudrait rflchir aux possibilits dintgrer dans les bases de donnes les informations dtenues par le public .
Structuration, recherche et interfaces : vers de nouvelles pratiques

Un grand nombre de conclusions de journes dtude consacres aux bibliothques numriques et plus gnralement aux sites web font tat des problmes poss par les questions daccs et dusages et par consquent dindexation. : La bibliothque numrique du futur se dessinerait plutt comme une bibliothque totalement personnalise que comme un outil collectif,
273.

Muriel Foulonneau, Collaborer pour de nouveaux services culturels en ligne : Le protocole OAI : Protocole de collecte de mtadonnes de lInitiative des Archives Ouvertes, Relais Culture Europe pour la Mission de la Recherche et de la technologie du Ministre de la Culture et de la Communication et le projet europen MINERVA, 2004. <http://www.culture.gouv.fr/culture/mrt/numerisation/fr/technique/documents/guide_oai.pdf> [fvrier 2007]. 274. <http://www.aim25.ac.uk> [fvrier 2007]. 275. <http://www.irisa.fr/imadoc/HTML/Welcome.html> [fvrier 2007]. 276. Aurlien Bnel, Expression du point de vue des lecteurs dans les bibliothques numriques spcialises , Confrence Internationale sur le Document Electronique 7 (CIDE) : Approches smantiques du document numrique, La Rochelle, 22-25 juin 2004.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 303/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

elle sorienterait vers la production de services plutt que vers lorganisation des collections et elle serait un lien dynamique entre les ressources et les personnes plutt quun stock de bases de donnes 277 . Or actuellement les bibliothques numriques sont construites autour de technologies et de techniques sans tude des usages. On dveloppe quelquefois des produits tout public souvent sans possibilit de retour en arrire tant donn lnergie considrable quil faut dployer pour mettre en place ces systmes. On tente de faire dans la plupart des cas de la bonne vulgarisation et parfois avec russite. Une tude pralable des usages et des habitudes de consultation et de navigation des futurs lecteurs permettrait de mieux cibler les outils. Un rapport Digicult dat de 2001 fait le constat suivant propos du SCRAN Scottish Cultural Resources Access Network 278 : 80 % de nos utilisateurs utilisent les recherches textuelles et seulement 20 % les recherches structures telles que les index. Nous avons besoin doutils qui soient conviviaux. Il ne sagit pas dadapter les utilisateurs lInternet, mais linverse. ou encore : Les interfaces de recherche doivent permettre aux utilisateurs de traduire des concepts en points daccs. Des interfaces simples et lgres, avec peu de points daccs, savrent plus adaptes la plupart des utilisateurs de lInternet 279 . Le projet Minerva propose la cration dun Dublin Core Culture280 permettant de localiser des donnes patrimoniales htrognes en se basant sur linterrogation par concept : Qui, Quoi, O, Quand. Il devient ncessaire pour le public de crer des points daccs normaliss vers les sites patrimoniaux pour largir lventail des rsultats. En guise de conclusion, on constate dune part le rle croissant des bibliothques dans le domaine du numrique en raison de leurs multiples missions de conservation, de diffusion de linformation, de mdiation culturelle et de formation. Ces tablissements sont appels jouer un rle majeur dans la redfinition et la redistribution des circuits dinformations quimpliquent les nouvelles technologies. Dautre part, le mouvement dmergence du patrimoine suscit par lInternet entrane le besoin croissant dchanges dinformations entre les lieux de conservation et la recherche. Dans ce cadre, il serait extrmement dommage que la recherche en histoire du livre soit exclue des discussions autour des mutations de lcrit. Dune faon gnrale, les interactions prciser ou mettre en place entre lhistoire du livre et le numrique contribueront une meilleure connaissance du document et la prise en compte de sa temporalit et de son contexte.
277.

Alia Benharrat, International Summer School on the Digital Library , BBF, 2004, n 2, p. 101-102, <http://bbf.enssib.fr> [fvrier 2007]. 278. <http://www.scran.ac.uk/>, [fvrier 2007]. 279. Muriel Foulonneau, op. cit., 2004, p. 43. 280. Muriel Foulonneau, Dublin Core Culture propos par le projet Minerva Qui, Quoi, O, Quand , dans Culture & Recherche, juillet-octobre 2003. <http://www.culture.gouv.fr/culture/editions/r-cr/cr97.pdf> [fvrier 2007]. Muriel Foulonneau, Un Dublin Core Culture pour accder des ressources patrimoniales htrognes, Relais Culture Europe, 2003. <http://www.culture.gouv.fr/culture/mrt/numerisation/fr/technique/documents/dc_culture.pdf> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 304/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Partie 7 - Numrique et perspectives africaines

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 305/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Bibliothques et numrique : enjeux pour lAfrique


Bernard DIONE Assistant lEBAD, Sngal
Rsum : La fracture numrique est presque toujours pose en termes conomiques et en termes dinfrastructures (nombre de postes dordinateurs, connexion, etc.) par les hommes politiques en Afrique. Cette tendance est lie lapproche technicienne ou technocrate qui a prsid lintroduction des TIC dans beaucoup de pays africains. Elle est donc uniquement pense en termes de retard technologique du Sud par rapport au Nord. Mais il nous semble que cette perspective nest que partielle, car elle nintgre pas la problmatique des contenus, cest--dire le document numrique lui-mme. Les bibliothques doivent donc dpasser cette approche technocrate de la fracture numrique pour rflchir sur limpact des ressources numriques sur leur environnement et les nouvelles perspectives quelles offrent en termes de services pour les communauts africaines de base.

Lapparition du document numrique et les collections lectroniques a fait natre de nouveaux espoirs dans le secteur des bibliothques africaines. Tout au long de notre propos, nous parlerons tantt de document numrique, de collections numriques, ou encore de ressources lectroniques. Cest pour cette raison quil ne serait peut-tre pas inutile de prciser tous ces concepts avant de tenter den cerner les enjeux pour les bibliothques africaines. Notre propos sintressera particulirement lAfrique au Sud du Sahara, et notamment lAfrique de lOuest francophone. Par le terme ressource numrique ou lectronique nous entendrons tout au long de ce propos une ressource informationnelle laquelle on accde au moyen d'un ordinateur, notamment par courrier lectronique, sur Cd-rom ou, le plus souvent, sur le Web. Ces ressources permettent d'accder un vaste ventail de documents et outils de recherche, parmi lesquels on trouve : les revues lectroniques ; les bases de donnes savantes ; les livres lectroniques ; les collections hybrides ; les portails d'information Internet qui contiennent des liens, souvent thmatiques, des sites Web prvalus et slectionns pour leur qualit et utilit , et les moteurs de recherche Internet. Ces ressources constituent ce que lon appelle les bibliothques numriques. En effet, Au sens strict, ladjectif numrique soppose au terme analogique et dsigne ltat de toute information (texte, son, image, etc.) stocke sous forme binaire (srie de 0 et de 1). Selon cette dfinition, tout

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 306/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

fichier informatique (Word, Excel, Xpress, etc.) est numrique puisquil contient des informations stockes sous forme binaire (Jhanno, E., 2000). Avec les ressources numriques, on parle de plus en plus de bibliothques numriques. Buhle Mbambo a mme tent de faire le point sur la bibliothque numrique en Afrique aprs avoir pass en revue quelques dfinitions de ce concept (Beebe, M.- A., 2003). Mais en raison des confusions qui entourent la dfinition de la notion de bibliothque numrique (Estermann et Jacquesson, 2000, Cleveland, 2000), nous nous contenterons de parler seulement des ressources lectroniques ou numriques. Ce choix se justifie dautant plus que, comme le notent Esterman et Jacquesson, compte tenu de limmense savoir dj disponible sur support papier, les documents numriques peuvent difficilement tre apprhends de faon isole, car ils constituent en fait, avec les documents imprims, un univers continu. Les bibliothques matrielles et numriques forment ainsi un tout homogne et cohrent quil y a lieu daborder avec la mme logique. On parle alors de bibliothques hybrides (Estermann et Jacquesson, 2000). Avec les ressources lectroniques, les bibliothques offrent donc des collections hybrides. Une bibliothque ou collection documentaire hybride est tout simplement une bibliothque qui contient la fois des ressources papier et des ressources lectroniques. L'accs se fait gnralement l'aide d'un systme de type catalogue interrogeable en ligne, pour permettre aux usagers de rechercher des informations sur un thme prcis et d'identifier des ressources. Ces ressources pourront se trouver sur les tagres de la bibliothque en question, ou dans une revue lectronique laquelle la bibliothque est abonne, ou dans un document enregistr dans le systme informatique de la bibliothque. Les copies lectroniques des thses et autres travaux de recherche acadmiques offrent lexemple type pour ce genre de document. Quel est aujourdhui limpact du document numrique sur la bibliothque en Afrique ? Avant de pouvoir rpondre cette question, il faut dabord sinterroger sur ltat des bibliothques du continent. Bien quil nexiste pas dtude exhaustive sur la situation, on peut affirmer sans risque de se tromper que loffre de service de bibliothques en Afrique est relativement pauvre (Diop, M. D., 2003, Maack, M.N.). Cela est encore plus vrai pour les bibliothques publiques. Une tude portant sur dix pays africains anglophones fait remarquer que :
The synthesis of literature quoted in the bibliography and the country reports portrays the public library movement in Africa as being very weak, with numerous problems regarding financial constraints lack of human resources, outdated materials and poor

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 307/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

use. The only sector of the African population that uses public libraries is school children. However, each country report illustrated that children do not use the materials held in the library but use libraries primarily as places for study, because they are quieter and more spacious than their homes (Issak, Aissa, 2000)

On pourrait en dire autant des autres types de bibliothques. Dans beaucoup de pays les bibliothques nationales sont inexistantes ou manquent totalement de dynamisme. Les bibliothques universitaires qui sont les seules merger du lot connaissent aussi bien des problmes que Kay Raseroka rsume en ces termes : University administrators sometimes lack an appreciation of the major components of the academic library that are the following :
Inputs: staffing, budgeting, information technologies, collections and physical facilities. Process: policy development and advocacy, collection development, organization and management. Outputs : user instruction individually and for university classes, human resource development, reference services, provision of finding tools catalogues and databases of local and region information, collections, archival and special collections and document delivery services.
Constant evaluation of services through ongoing feedback from stakeholders: students, staff and public (Raseroka, K, 1999)

Le manque de personnel qualifi de haut niveau dans ces bibliothques pour contrebalancer ce dficit de vision des autorits acadmiques, a fini par rduire la mission des bibliothques africaines la tche de constitution des collections ncessaires pour la conduite des curricula de luniversit (Raseroka, K, 1999). Le plus souvent, cette activit sera mene de manire purement quantitative, sans tenir compte de lobsolescence des documents. Lobjectif principal de la bibliothque tant doffrir aux tudiants, aux enseignants et aux chercheurs de luniversit, les documents ncessaires leurs activits, on estimera que plus la collection est importante, plus elle sera susceptible doffrir le document recherch. Les problmes lis au dveloppement des collections ont t largement analyss (Ifidon, 1990 ; Nwafor, 1989). Les politiques dajustement structurel et les coupes budgtaires qui en ont dcoul ont profondment affect les budgets des universits, et de manire encore plus aigu ceux de leurs bibliothques. Ces dernires, qui achetaient 95 % de leurs collections avec des devises (Levey, 1993 ; Ifidon, 1990 ; Nwafor, 1989), ont vu leurs acquisitions se rduire et mme disparatre durant ces deux dernires dcades (Coombe, 1991). Cette tendance sest davantage renforce avec la

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 308/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

dvaluation de certaines monnaies locales comme le CFA (voir article de Mme Tine dans lcluse). Par consquent, les bibliothques universitaires africaines ntaient plus en mesure de contribuer de manire significative laccomplissement de la mission de leurs institutions de tutelles. Avec le dveloppement des nouvelles technologies de linformation et de la communication, une lueur despoir est apparue dans le secteur des bibliothques universitaires. Les collections numriques offrent aux bibliothques et bibliothcaires africains une nouvelle opportunit de se repositionner. Mais on peut se demander dans quelle mesure les bibliothques africaines ont intgr les collections numriques. En effet, lapprovisionnement en ressources lectroniques des bibliothques des pays du Sud aujourdhui essentiellement assur par un certain nombre dinitiatives nes dans les pays du Nord, et ce afin de rduire le foss numrique entre les bibliothques du Sud et leurs homologues du Nord commencent peine se dvelopper. Plusieurs organismes ont mis sur pied des programmes ayant pour objectif de permettre aux bibliothques universitaires africaines de disposer de collections numriques et de renforcer les capacits de leurs bibliothcaires dans la gestion des documents numriques. Un bref survol des initiatives pourrait permettre de se faire une ide du chemin parcouru, de ce qui reste faire et surtout des enjeux. Les principales initiatives offrant un accs gratuit ou faible cot linformation pour les pays en dveloppement sont HINARI (Health InterNetwork Access to Research Initiative), EIFL (Electronic Information for Libraries), EJDS, ACU (Association of Commonwealth Universities), HIGHWIRE, PERI (Programme for the Enhancement of Research Information) et TEFAL (The Essentiel Electronic Agricultural Library). Une tude dvaluation de laccs aux ressources lectroniques des pays en dveloppement 281 ralise dans le cadre du programme PERI (Programme for the Enhancement of Research Information) 282 de lINASP, qui lui-mme offre un accs plus de 8 000 journaux en texte intgral aux chercheurs du Sud, montre que 67 % des diteurs commerciaux ayant rpondu lenqute, ont particip a lune de ces initiatives, tandis que 33 % conduisent leur propre initiative. Pour les diteurs non commerciaux interrogs : 23,5 % seulement participent a ces initiatives, 21 % ont leur propre initiative, contre 40,5 % qui ne participent aucune initiative.

281

282.

. E-journals : Developing Country Acess Survey. Disponible sur : <http://www.inasp.info/peri/> [fvrier 2007]. <http://www.inasp.info/peri/index.html> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 309/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

De toutes ces initiatives, la toute premire semble avoir t le projet HINARI. Ce projet a t lanc en septembre 2000 par lOMS dans le but de combler le foss digital qui existe dans le domaine de la sant, en s'assurant qu'une information approprie et les technologies pour la fournir soit largement disponible et pertinemment utilise par le personnel de sant : professionnels, chercheurs et scientifiques, dcideurs. Il offrait environ 1 500 publications scientifiques qui forment une des plus grandes collections de littrature biomdicale du monde, grce aux efforts de l'OMS et des six plus grands diteurs dans le domaine biomdical : Blackwell, Elsevier Science, le Groupe Harcourt Worldwide STM, Wolters Kluwer International Health & Science, Springer Verlag et John Wiley 283 . La seconde phase de ce projet a t lance en janvier 2003. Ces diteurs de revues lectroniques lanceront dailleurs plus tard une initiative visant offrir un accs aux pays pauvres. En effet, le 10 juillet 2001, Chronicle of higher education 284 annonait que six diteurs (Blackwell, Elsevier Science, the Harcourt Worldwide STM Group, Lippincott Williams & Wilkins, Springer Verlag and John Wiley) avaient dcid doffrir aux pays pauvres un accs libre, ou tout du moins faible cot, aux revues lectroniques. De cette initiative est n le projet IDEAL Charter for Low Income Countries. Le projet IDEAL tait sponsoris par lInternational Association of Scientific, Technical and Medical publishers (IASTMP), International Network for the Availability of Scientific Publications (INASP) et le Third World Academy of Sciences (TWAS), et offrait 143 journaux publis par Harcourt Health Sciences et 177 revues publis par Academic Press. Ce projet a pris fin en dcembre 2002 avec le rachat de Academic Press par Elsevier. Lune des composantes du programme PERI vise offrir un accs plus de 8 000 journaux en texte intgral aux chercheurs du Sud. Certaines bibliothques francophones, comme la bibliothque centrale de lUniversit Cheikh Anta Diop et la bibliothque lUniversit dAbidjan bnficient dj de ce programme. Lespoir que suscitent les collections numriques pour combler le foss sparant info riche est info pauvre doit amener les bibliothcaires se poser une question essentielle : laccs au document numrique dans les bibliothques africaines peut-il tre abandonn ces seules
283. 284.

<http://www.healthinternetwork.org/index.php?lang=fr> [fvrier 2007]. <http://chronicle.com/free/2001/07/2001071001t.htm> [fvrier 2007].

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 310/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

initiatives ? Nest-il pas indispensable de mettre en place des politiques cohrentes daccs aux ressources numriques ? Cette question mrite dtre pose lorsque lon sait que chez la plupart des dcideurs politiques africains, le discours sur le foss ou la fracture numrique met souvent beaucoup plus laccent sur les infrastructures et les quipements, que sur les contenus. En effet, cette expression trs la mode dsigne lcart entre ceux qui ont accs Internet et aux grands rseaux dchanges dinformation et ceux qui en sont privs. La fracture numrique nest donc pas un problme spcifiquement africain. Dailleurs, le concept lui-mme semble avoir merg des USA o lexpression semble tre lance ds 1995. Cest du moins lavis de Beloeil et de ses collaborateurs, qui notent que L'expression foss numrique et la rflexion sur les moyens de le combler, viennent tout droit des tats-Unis. Ds juillet 1995, le ministre du Commerce amricain signale dans un rapport les disparits croissantes d'accs au rseau entre riches et pauvres, et entre ethnies. On ne parle pas encore de foss numrique, mais l'expression perce dans les discours publics (Beloeil, M., Gitel, G., Macotsis, N., 2001). De manire gnrale, on peut dire que dans les pays du Nord, la fracture numrique recouvre souvent la fracture sociale, cest--dire les ingalits au sein de la population. Alors quau Sud, outre lcart entre riches et pauvres, la fracture numrique signifie la marginalisation de prs de 98 % de la plante du fait de la faiblesse de linfrastructure permettant de tirer le meilleur parti du numrique. Sans insister sur des statistiques amplement disponibles, notons seulement que l'Afrique, qui fournit 13 % de la population mondiale, pse moins de 1 % dans le cybermonde. Mike Jensen note que But of the approximately 816 millions people in Africa in 2001, only 1 in 130 had a personal computer (PC) and 1 in 160 used the Internet (Beebe, M. A. et alii 2003). Il en tait de mme pour laccs au rseau tlphonique : En 1992, 49 pays du Sud avaient moins dune ligne pour 100 habitants, 35 de ces pays taient africains (Beloeil, M., Gitel, G., Macotsis, N., 2001). On le voit donc, le rle de la faiblesse de linfrastructure dans laccs au document numrique en Afrique est assez important. Cet tat de fait est lorigine de lapproche purement technico-conomique des dcideurs africains de ce phnomne. Des projets ont mme t initis pour faciliter laccs au PC dans certains pays. Par exemple en Cte-dIvoire, le projet Dragados entrait dans cette logique. Ce projet initi par le Ministre de lEnseignement Suprieur ivoirien et financ par la coopration espagnole se rsumait dans lexpression image et fort sduisante : un enseignant-chercheur un ordinateur (Aghi, A. B., 2004).

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 311/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

Cependant, peut-on penser quil suffit seulement de disposer de plus dordinateurs et dune meilleure connexion pour que le problme soit rgl ? Mais les ordinateurs et la connexion suffiront-ils seulement pour combler le foss numrique ? On a souvent nglig des phnomnes essentiels comme lanalphabtisme dont souffre la majorit de la population et ce que lon pourrait appeler lillettrisme informatique, cest--dire le fait de ne pas savoir utiliser un matriel informatique. Mais nous ninsisterons pas outre mesure sur ces questions. Nous poserons seulement les questions suivantes : ne serait-il pas judicieux de tenir compte, dans la rflexion sur le foss numrique, des opportunits quoffre le document numrique pour assurer une meilleure prsence africaine sur les rseaux mondiaux ? Quel doit tre le rle des bibliothques dans cette bataille des contenues sur Internet ? En effet, il est indniable que laccs lInternet ouvre bien la perspective dune possibilit de disposer dnormes ressources informationnelles travers le monde. Mais un point sur lequel le discours des dcideurs sur le foss numrique ninsiste pas, est que laccs une information de qualit ne saurait tre gratuit. La connexion donne le plus souvent un accs au Web visible. Or, lInternet est comme un iceberg, la partie invisible reprsente prs de 260 fois le Web visible. Et lessentiel de linformation stratgique se trouve sur cette partie invisible, de mme que les cots daccs sont souvent hors de porte des bibliothques africaines. Une approche centre sur les opportunits du document numrique pourrait permettre de surmonter ce problme. Mais, avant daborder ce point, faisons remarquer que de toute faon, bien que ce ne soit pas lobjet de notre propos ici, le discours visant accrditer la possibilit dun dveloppement rapide par les TIC est de plus en plus dnonce comme tant un mythe (Hane, I., 2004). En outre, certains pensent que si le numrique a jou un rle important dans les pays du Nord, cest parce que leur structure conomique et sociale y tait favorable (Davidson, et alii). Ces diffrentes thses font penser quil est indispensable de conduire des tudes sur lappropriation des TIC sur le continent. Mais sur ce terrain, il faut surtout remarquer que le discours sur la fracture numrique cache en ralit labsence dune rflexion approfondie, dans certains pays africains, sur les apports du numrique. En effet, le dveloppement des TIC dans bien des pays africains a t, depuis le dbut, laffaire des seuls techniciens. Ces derniers ont impos leurs choix toutes les composantes de la socit. Ils ont fait comme si lintroduction et lutilisation des TIC taient des phnomnes normaux, naturels, intrinsquement positifs, sinscrivant dans le cours naturel de la modernisation de la socit, et, par consquent ne mritant ni rflexion, ni dbat (Sagna, O., 2001). Or, que va-t-on

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 312/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

aller chercher sur les rseaux ? Quels sont les vrais enjeux du numrique en Afrique pour les bibliothcaires que nous sommes ? Il ny a aucun doute que les collections lectroniques sont appeles jouer un rle de plus en plus croissant dans laccs linformation en gnral et linformation de recherche en particulier. Toutes les bibliothques, quelle que soit leur catgorie, doivent intgrer rapidement le numrique dans la gestion de leurs collections. En effet, elles ne peuvent pas se couper des nouveaux moyens dinformation et de communication au risque dun isolement fatal (Estermann et Jacquesson, 2000). Lintroduction des collections numriques constitue une innovation majeure qui affecte toutes les oprations documentaires et la profession du bibliothcaire. Dabord en termes de constitution des collections. Le document numrique a un don dubiquit qui renforce la reprsentation utopique au sens premier de ce terme, dun espace dans lequel les frontires gographiques sont abolies, dans lequel les notions de temps et despace sont remplaces par la notion de temps rel , un espace virtuel dans lequel chacun peut trouver sa place, tre la fois acteur et spectateur, et naviguer dans un bain dinformations source oblige de savoir et de connaissance (GRESICO, 1998, p. 34). Cela introduit une premire dichotomie fondamentale : lopposition entre lacquisition et laccs (Line, 1996 ; Stoffle, et alii, 1999 ; Esterman et Jacquesson 2000, Lee 1999). Traditionnellement, le bibliothcaire rpondait aux besoins de ses clientles en acquerrant des collections de documents quil traitait et stockait pour ensuite les offrir aux lecteurs dans les salles de lecture. Lorsque le document requis ne figurait pas dans sa collection, il recourrait au prt interbibliothque. Ce service tait donc un supplment indispensable de lacquisition et de la constitution des collections : il suppose quune autre bibliothque a acquis et conserv le document. Le document lectronique fait exploser ce paradigme. Le bibliothcaire a souvent aujourdhui le choix entre une version imprime ou une version papier, surtout lorsquil sagit des revues scientifiques. Au lieu dacqurir ces ressources, il peut simplement ngocier une licence daccs. Il nest plus oblig de stocker et dentretenir des kilomtres linaires de documents en attendant quun usager hypothtique en ait besoin. Les documents numriques prsentent lavantage de supprimer le temps et la distance et peuvent ainsi, tre utiliss par plusieurs institutions.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 313/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

En effet, contrairement aux collections matrielles, ces ressources ntant pas stockes entre les quatre murs dune bibliothque donne, mais accessibles via un rseau, plusieurs bibliothques cooprent pour ngocier des licences. Les ressources lectroniques ont ainsi modifi le concept traditionnel de coopration. Elles ont pouss les bibliothques se constituer en consortiums pour tirer le plus grand profit de lenvironnement numrique. Ce qui constitue une nouvelle opportunit pour les bibliothques universitaires africaines de mettre en commun leurs faibles moyens pour une plus grande satisfaction de leur clientle. Avec les collections numriques, les bibliothques du Sud et les bibliothques africaines nourrissent aujourdhui lespoir de combler le foss numrique (Salinas, 2003). Les bibliothques africaines doivent, selon leurs catgories, se constituer en consortium pour mettre en commun leurs faibles ressources, afin de ngocier des licences nationales utilisables par tous les chercheurs dinformation du continent. Mais cela suppose de la part du bibliothcaire africain un changement radical dans la perception de la gestion des collections. Il faut quil sache dsormais quil ne gre plus seulement des documents. Il doit tre rsolument tourn vers lutilisateur. Il doit scruter son besoin pour trouver dans loffre disponible la bonne information capable de le satisfaire. De la gestion des collections il doit se tourner rsolument vers la gestion de linformation, du savoir et de la connaissance. Il lui faut mditer le mot de Stoffle, Fore et Allan lorsquelles crivent : The impetus for our radical changes was the Task Force on Access and Ownership Study and Report. This report called for a rethinking of our collection development function and for moving our focus from artefacts and management of artefacts to a focus on customers and their information needs (Brin and Cochran, 1994). Couched in terms of access, the recommendations urged the Library to look to the future and the potential of new technology to help us move to an information management concept. It recommended our primary goal become meeting customer information needs in the shortest turnaround time possible. This rethinking was based on the economics of the print ownership and print information management environment . La mise en commun des ressources est dailleurs un impratif pour les bibliothques africaines. En effet, le cot de la documentation augmente rgulirement, surtout pour les priodiques, avec ce que lon a appel la serial pricing crisis . Les bibliothcaires taient souvent obligs de supprimer chaque anne des titres. Dans les pays dAfrique au Sud du Sahara, plusieurs bibliothques universitaires avaient mme cess de prendre des abonnements de priodiques du fait de la dvaluation de leur monnaie et du renchrissement du cot des documents (Levey, 1993). Les

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 314/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

ressources lectroniques leur offrent nouveau la possibilit de rpondre aux besoins rels de leurs clientles la demande. Mais les collections lectroniques noffrent pas que des opportunits. bien des gards, elles prsentent des menaces. Lune de ces menaces est constitue par la rapide croissance et linstabilit du Web. Les chercheurs dOCLC ont calcul que la dure de vie moyenne dune page Web est de 6 semaines. Cette croissance et cette instabilit sont mettre en rapport avec les enjeux lis larchivage de documents lectroniques. Le caractre stratgique de lenjeu de larchivage a t soulign par le GIRA (GIRA, 2002). En effet, les technologies qui sont utilises pour la cration, le traitement et la lecture des documents numriques deviennent rapidement obsoltes. La prennit des logiciels nest pas garantie par le processus de mises jour continues qui visent dabord et avant tout sapproprier des parts de march. Cette obsolescence technologique se traduit notamment par lillisibilit des formats dencodage et des supports de stockage de linformation qui, en combinaison avec labsence de mtadonnes, constitue autant de facteurs qui contribuent rendre la mmoire orpheline (GIRA, 2002). Ce problme de larchivage numrique est une question qui mrite une rflexion approfondie. En plus de linstabilit des documents accessibles via Internet, il faut noter que, du fait de linstabilit des technologies qui les portent, ceux qui sont disponibles sur des disques durs, des disquettes ou des cdroms, bien que conservs comme les imprims, noffrent pas plus de scurit. Nos bibliothques sont incapables dacqurir certains logiciels et de suivre leur volution rgulire. Une solution intgrant des logiciels libres ou faible cot est incontournable. Mais le problme de larchivage nest pas la seule menace. Le cot daccs linformation en constitue aussi un autre enjeu majeur. Jean-Claude Gudon a clairement montr la stratgie dveloppe par les diteurs pour transformer la rvolution du numrique en une contrervolution (Gudon, 2001). Le cot des licences reste cher pour les bibliothques des pays en dveloppement. Ce qui repose la question du financement de laccs aux ressources lectroniques pour les populations du Sud en gnral, et pour les chercheurs en particulier. En effet, en raction la tendance la constitution de monopoles dans ldition lectronique, et au renchrissement des cots des ressources lectroniques, les universits ragissent dj et donnent de nouvelles attributions aux bibliothques universitaires (Okret-Manville, 2002). Les services de documentation de lenseignement suprieur doivent aujourdhui choisir entre deux options : devenir exclusivement des lieux daiguillage vers des rservoirs de ressources payantes

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 315/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

dont la matrise leur chappe, ou paralllement contribuer la construction des bibliothques numriques daccs libre places sous leur contrle 285 . Cette rflexion pourrait tre tendue aux autres types de bibliothques en Afrique. Les bibliothcaires du continent doivent investir le secteur de ldition et de la diffusion numrique. Il ne sagit pas de concurrencer les diteurs commerciaux, mais de recueillir grce des outils lgers, sur supports numriques, des documents souvent indits et souvent menacs de perte parce que ports par loralit et la mmoire humaine. Que lon se souvienne du mot dAmadou Hampath Ba : En Afrique un vieillard qui meurt est une bibliothque qui brule. En effet, le document numrique fdre tous les autres types de supports qui le prcdent. Il est capable de recevoir du texte, de limage, du son et du mouvement. La culture africaine tant souvent considre comme une culture orale, le document numrique ouvre des perspectives intressantes pour sa gestion. En effet, il offre des possibilits de recueillir les savoirs africains indignes, les coutumes, les traditions et tous les faits des civilisations pour constituer des banques de connaissances essentiellement africaines et ainsi les offrir en partage au monde entier. Cela permettrait aux populations autochtones africaines de contribuer la cration des savoirs, dapporter leur point de vue et leur vision du monde par rapport aux grandes interrogations contemporaines. Le document numrique est donc, selon le mot de Gudon, en mesure de rconcilier au niveau mondial information et communication . En effet, note Gudon, entre partager et donner en partage se loge une distinction trop souvent nglige. Le premier seffectue sur la base dgalit et de rciprocit, ce que nous appellerons ici communication. Le deuxime, en revanche, correspond un transfert unidirectionnel de messages, un processus dinformation (Gudon, 2000). Mais, les enjeux du numrique pour les bibliothcaires posent aussi de manire plus aigu la question de la formation des personnels des bibliothques. Avec la construction des bibliothques numriques, de nouvelles tches attendent les bibliothcaires. Les implications de cette volution en matire de comptences requises, et par consquent de formation, sont multiples (Okerson, 1996 ; Estermann, 2000). Les bibliothcaires doivent acqurir, entre autres comptences, une culture du document structure, apprendre de nouveaux formats de la famille XML, les DTD du monde documentaire et ditorial (EAD, TEI, etc.), tre capables de grer des mtadonnes, connatre les
285.

Une ambition universitaire lgitime : construire les bibliothques numriques.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 316/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

modles conceptuels de donnes et leur description, tre en mesure de grer une chane de conversion de formats diffrents, etc. Enfin, on ne saurait terminer ce propos sur les enjeux du numrique en Afrique sans plaider pour une intgration des tlcentres communautaires dans les bibliothques.

Bibliographie
AGHI, A.-B., tude sur les TIC et pratiques de recherche dinformation chez les enseignants et chercheurs universitaires ivoiriens. Communication la Confrence sur la publication et la diffusion lectronique organise par le CODESRIA, Dakar, 1-2 septembre 2004. BEEBE, M.-A., et alii, Africa Dot Edu: IT Opportunities And Higher education in Africa. New Delhi, Tata McGraw-Hill. BELOEIL, M., La fracture numrique. Mmoire ralis dans le cadre de la confrence de Emmanuel Marcovitch : Internet et le numrique , 2000-2001. <http://www.ifrance.com/Fracturenumerique/> [fvrier 2007]. CHISENGA, J., The Use of ICTs in African Public Library Services: A survey of ten countries in Anglophone Africa, Oxford : INASP, 2004. DIOP, M.-D., Les bibliothques au Sngal : tat des lieux, Dakar, Goethe Institut InterNationes. EBAM ETTA, F., PARVYN-WAMAHIU, S., Information and Communication technologies For Development in Africa. Volume 2, The experience with community Telecenters, Dakar : IDRC : CODESRIA GIRA, Les archives lectroniques : une mmoire orpheline ou en mutation : Actes/du 4e symposium du GIRA, tenu aux Archives nationales du Qubec (Montral), Montral, 22 mars 2002. GRESICO, Communication, socit et Internet : actes du GRESICO de Vannes, Universit de Bretagne Sud 10 au 11 septembre 1998, Paris, Harmattan. HANE, I., NTIC, une mythologie du dveloppement en Afrique : rponses aux laudateurs , Le Matin, mardi 11 et mercredi 12 mai 2004. ISSAK, A., Publics Libraries in Africa: a report and annotated bibliography, Oxford : INASP, 2000. JEHENNO, E., Enqute sur la filire du livre numrique : enqute ralise davril aot 2000 pour le Centre de Sociologie des Organisations (CNRS), Paris, Ed. 00h00, 2000.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 317/318 -

Le numrique : impact sur le cycle de vie du document, 2004, Montral.

OSSAMA, F., Les nouvelles technologies de linformation et de la communication : enjeux pour lAfrique sub-saharienne, Paris, Harmattan, 2001. RASEROKA, H.-K, The Role of University Libraries in African Universities, Accra, AAU. SAGNA, O., Les technologies de linformation et de la communication et le dveloppement social au Sngal : un tat des lieux, Genve, UNRID, 2001. STOFFLE, C., FORE, J., ALLEN, B., Developing New Models for Collection Development , in Lee, S. H., Collection Development in the Electronic Environment: shifting Priorities, New York, The Haworth Press, 1999. THIOUNE, R.-M. (d.), Potentialits et dfis pour le dveloppement communautaire , Technologies de linformation et de la communication pour le dveloppement en Afrique, vol. 1, Dakar, CRDI, CODESRIA, 2003.

Document consultable sur http://www.enssib.fr/bibliotheque-numerique/

- 318/318 -

S-ar putea să vă placă și