Sunteți pe pagina 1din 6

La conservation des bases de donnes Marc Lebel, m.b.a.

Chef de la Section de la gestion de documents Ville de Montral Charg de cours La prennit des informations numriques proccupe les archivistes. Elle pose des dfis au niveau du stockage et la restitution des documents lectroniques afin den assurer la conservation et lintgrit. Plusieurs groupes de recherches sintressent de faon pertinente ces questions. Il me semble que la problmatique de la conservation permanente des bases de donnes nobtient pas toute lattention quelle mrite compte-tenu de limportance des bases de donnes dans les administrations. Cette communication expose la comprhension et les proccupations dun praticien face la problmatique de la conservation des bases de donnes. Il aborde limportance des bases de donnes dans les organisations, les pratiques actuelles et quelques considrations pour la conservation permanente des bases de donnes. Finalement, il prsente, comme piste de solution, lutilisation des entrepts de donnes. Bien modestement, cette communication peut dgager des pistes de recherches afin de solutionner cette problmatique. Dfinition Pour ce texte, une dfinition restrictive dune base de donnes est retenue. a database as a structured collection of data items stored, controlled, and accessed through a computer based on predefined relationships between predefined types of data item related to a specific business, situation, or problem. (Alter, p. 512) paper memos in a file cabinet are not a database because they are not accessed through a computer. Similarly, the entire World Wide Web is not a database of this type because it lacks predefined relationships between predefined types of data item (Alter, p. 116). Limportance des bases de donnes Les bases de donnes sont au cur des oprations des organisations. Elles supportent des activits comme la gestion des commandes, les relations avec les clients, la planification de la production, la gestion du personnel. titre dexemple, les grandes socits de services publics grent tous leurs dossiers clients grce des bases de donnes; les documents sur support papier deviennent accessoires. Toutes les informations oprationnelles vitales pour les organisations sont consignes dans les bases de donnes. Les bases de donnes sont essentielles lautomatisation des processus daffaires, du commerce lectronique, etc. Utiliss de faon intensive depuis le dbut des annes soixante, la problmatique de leur conservation se pose avec acuit.

Bien quomniprsentes, les bases de donnes seront davantage utilises aux cours des prochaines annes. Entre autres, les investissements massifs 1 pour limplantation de systme intgr de gestion (SIG ou ERP en anglais) et les systmes de gestion des relations avec les clients dmontrent limportance toujours croissante des bases de donnes. Les pratiques actuelles Peu dorganisations disposent de programmes structurs pour lpuration de leurs bases de donne et pour leur conservation long terme. Cette situation peut sexpliquer, en partie par les cots associs lpuration et la conservation des bases de donnes. En labsence dpuration des bases de donnes, des dlais supplmentaires sont ncessaires pour: reprer dun champ dans la base de donnes, complter une transaction, effectuer une copie de sauvegarde, accomplir une opration de maintenance

Dans certains cas, les lgislations obligent lpuration des renseignements personnels des bases de donnes lorsque l'objet pour lequel un renseignement nominatif a t recueilli est accompli, l'organisme public doit le dtruire (Loi sur les archives). Il existe plusieurs termes pour dsigner lpuration dune base de donnes et la conservation dune base de donne. Quatre pratiques sont courantes mais ne constituent pas un archivage en sens archivistique du terme. La copie de sauvegarde (backup) est une duplication de la base afin de la rcuprer en cas de dsastre ou daltration la base de donnes. Elle ne respecte aucun critre visant le recouvrement des donnes long terme. Lpuration des donnes reprsente la destruction des donnes sans lintention de les rcuprer. Lentrept de donnes (data wharehouse) est le transfert dune partie des informations vers un systme distinct (lentrept). Nous discuterons plus loin de cette opration qui peut tre utile pour la conservation permanente des donnes. Finalement, les donnes sont transfres dans un systme statique. Cette dernire solution mrite une attention particulire puisquelle est largement rpandue. Le transfert des donnes vers un systme statique prend plusieurs formes: limpression des donnes sur papier, la production de microfiche (fiche SOM) ou le transfert des donnes dans des fichiers plats. Dans le cas des bases de donnes complexes, seulement une partie des donnes seront reproduite puisquil est difficile de reproduire toutes les donnes dans une seule liste. Plus dplorable, ces systmes statiques ne reprsentent pas les relations entre les diffrentes donnes ce qui empche une bonne comprhension du contexte dutilisation des donnes. Les systmes statiques rduisent considrablement le potentiel de recherche. Dans
1

Mentionnons la Socit des Alcools du Qubec et son projet VSOP de 95 millions de dollars, la Ville de Montral et ses investissements de 50 millions, Hydro-Qubec pour 42 millions. Au cours des dernires annes, des firmes prives, telles Alcan, Pratt & Whitney, Bombarder, ont procd limplantation de tels systmes

le cas des impressions sur papier et des microfiches, certaines recherches deviennent pratiquement impossibles. titre dexemple, pensons une recherche dans les donnes dun recensement comprenant des millions dlments. Le chercheur devra lire chaque enregistrement. Thoriquement, il existe des mthodes pour recharger ces informations dans une base de donnes. En pratique, les cots dune telle opration sont prohibitifs donc inabordables pour la majorit des projets de recherche. Malgr ces limites, le transfert des donnes vers des systmes statiques est une pratique courante. Faute de moyens et dalternatives viables, il sagit de la principale stratgie darchivage des donnes la Ville de Montral. La valeur historique des bases de donnes La valeur archivistique des bases de donnes ne fait pas de doutes. Des informations auparavant sur support papier et conserves en permanence sont maintenant cres et consignes que dans des bases de donnes. Par exemple la Ville de Montral, le nombre de documents papier conservs aux dossiers demploys a diminu de 80 % depuis 1980. Cette rduction sexplique essentiellement par lutilisation des bases de donnes pour grer le personnel. Un chantillonnage des dossiers demploys tait conserv en permanence. Dornavant, il faudra donc conserver le dossier physique et les bases de donnes ddies la gestion de personnel. Linformation, peu importe son support, conserve sa valeur de tmoignage. La structure des bases doit tre prserve des fins de reconstitution des pratiques de travail et comme tmoignage de lutilisation des technologies de linformation dans les organisations. Les composantes comme les tables, les champs, index, les relations entre les tables et les rapports produits doivent donc tre conserves. Toute la documentation ncessaire la comprhension de la base de donnes doit tre galement prserve; cette dernire est souvent sous forme lectronique et intgre au logiciel servant au dveloppement de la base de donnes. Lvaluation des bases de donnes Comme pour tout document, larchiviste devra faire lvaluation des bases de donnes. Toutes les bases de donnes ne mritent une conservation permanente. Lvaluation devra galement prciser le moment et la frquence de versement des fins de conservation permanente. Contrairement aux documents sur support papier, il est impossible didentifier une version dfinitive dun document puisque le contenu des bases de donnes est constamment modifi. La description des bases de donnes Au premier niveau, une base de donnes peut tre dcrite selon les rgles de description des documents darchives en vigueur. Cependant, la description dune base de donnes demande davantage de prcision puisque chaque lment (table, champ) dune base de donne doit tre dcris. Sans description, le champ No de tlphone nest pas significatif. cette fin, la norme ISO/IEC 11179

Technologies de l'information -- Spcification et normalisation des lments de donnes doit tre retenue. Cette norme devra tre applique ds la conception des bases de donnes pour uniformiser leur description toutes les tapes de leur vie. Le format et la technologie de conservation des bases de donnes La question du format de conservation des bases de donnes demeure entire et complexe. Le dveloppement de solution conomique est essentiel pour que les organisations mettent en place des programmes de conservation. Les grandes institutions darchives ont dvelopp des modles et des applications informatiques pour la conservation des bases de donnes. Mentionnons, entre autres, Constance des Archives Nationales de France, AERIC de la U.S. National Archives and Records Administration, Ericson la Bibliothque et Archives Canada. Les solutions choisies par ces initiatives peuvent tre regroupes en quatre grandes catgories: prservation de la technologie originale pour conserver les informations, muler la technologie originale sur de nouvelle plate-forme, migrer les logiciels et les donnes vers les formats plus rcents, convertir les informations vers des formats plus standard.

premire vue et des recherches pourraient le vrifier, la conversion des informations vers des formats plus standards semble lalternative la plus conomique. Les cots seraient minimiss par: lentretien dune seule plate-forme technologique, la diffusion des bases de donnes archives ( par internet ou autrement ) partir dun seul format, la conversion des donnes vers un seul format permettant le dveloppement dune expertise en la matire, la migration pour suivre les changements technologiques dune seule plateforme et dun seul format.

Un consensus dans le milieu archivistique propos du format standard permettrait de maximiser ces avantages. Les normes de conservation Les normes de conservation des donnes devraient sinspirer de celle des entrepts de donnes, qui regroupent lensemble des donnes dune organisation dans un seul systme. Leur laboration ne dcoule pas de besoins archivistiques mais des demandes des gestionnaires pour effectuer des recherches croises. Les entrepts de donnes sont galement utiliss pour une conservation intermdiaire aprs lpuration des bases actives. Dans un entrept, les donnes ont les caractristiques suivantesqui rpondent aux proccupations des archivistes: elles sont intgres ou normalises. Par exemple, la longueur du champ prnom aura toujours la mme forme;

elles sont dates et non-modifiables; elles ne doivent pas tre volatiles afin de pouvoir rpter les recherches.

De plus de donnes, les informations peuvent tre dtailles ou bien agrges. Ce choix dcoulera de lvaluation archivistique. Grce la centralisation des donnes, des recherches croises sont possibles. Par exemple, il sera possible de faire une corrlation entre laugmentation du budget ddi au marketing et les rsultats des ventes. Lintervention de larchiviste Si lentrept de donnes est retenu pour la conservation des bases de donnes, larchiviste doit intervenir ds leur cration au stade actif. Une intervention tardive entranerait des cots importants si des modifications sont demandes et des informations pourraient irrmdiablement dtruite. Idalement, lentrept de donnes utilis des fins administratives contiendrait toutes les informations conserver en permanence. Au besoin, une puration additionnelle serait effectue lors du versement dans lentrept dfinitif. Un parallle avec la thorie des trois ges peut tre tabli: au stade actif, les donnes sont conserves dans les bases courantes, au stade semi-actif, les donnes sont conserves dans les entrepts de donnes administratives, pour la conservation permanentes, les donnes sont conserves dans les entrepts de donnes dfinitives.

Conclusion Les entrepts de donnes semblent, premire vue, une solution prometteuse et conomique pour la conservation permanente des bases de donnes pour les moyennes et grandes organisations puisquil sagit de rcuprer des applications dveloppes pour rpondre aux besoins administratifs. Cette solution est probablement trop onreuse pour des petites organisations o les entrepts de donnes sont inexistants. Des moyens plus adapts sont prvoir. Avant de gnraliser cette pratique, il faut cependant vrifier si elle permet de conserver toutes les donnes utiles sans leur altrer leurs caractristiques originales, sans perdre le contexte de leur cration. Les praticiens et les chercheurs devront rpondre ces questions puisque la ncessit de conserver des bases de donnes est incontournable. Sources Alter, Steven, Information systems, a management Perceptive, Addison_wesley, Reading Mass, 1999, 523 p. Boussaid Ormar, Lallich, Stphane, Entreposage et fouille des donnes, Toulouse : Cpadus, 2003, 282 p

Gouvernement du Qubec, Loi sur les archives, L.R.Q., c. A-2.1 Mensching, James, Corbitt, Gail, ERP data archiving a critical analyst, The Journal of Enterprise Information Management, Volume 17 Number 2, pp. 131-141.

S-ar putea să vă placă și