Documente Academic
Documente Profesional
Documente Cultură
Preservacin y conservacin
de documentos digitales
JOS MANUEL BARRUECO
330
331
Captulo 7
Preservacin y conservacin de documentos digitales
(Jos Manuel Barrueco)
330
332
333
334
336
338
P R E S E RVA C I N Y C O N S E RVA C I N D E D O C U M E N TO S D I G I TA L E S :
INTRODUCCIN
instituciones de investigacin, pblicas y privadas, a velar por la preservacin de los documentos relativos a las investigaciones. En esta afirmacin estn directamente implicados los servicios de publicaciones universitarios por el carcter de distribuidores y difusores de la produccin cientfica de cada universidad.
Si bien el problema de la preservacin digital es arduo y complicado, y en cuanto que
los principales implicados en el tema de la conservacin son bibliotecas y archivos, es
importante notar que los productores de documentos pueden facilitar la tarea desde el
momento mismo del diseo de los documentos. El proceso de preservacin y archivo se
hace de forma ms eficiente cuando se pone atencin en las cuestiones de consistencia,
formatos, normalizacin y descripcin bibliogrfica en los primeros pasos del ciclo de vida
de la informacin. Por ello, se enfatiza la importancia de considerar buenas prcticas de
conservacin en todos los estados del ciclo de vida de gestin de la informacin: creacin,
adquisicin, catalogacin, almacenamiento, preservacin y acceso.
As, en el presente captulo nos centramos en una serie de recomendaciones bsicas
a cumplir a la hora de disear documentos digitales para que puedan perdurar en el tiempo y sea fcil trasferirlos o convertirlos a otros formatos cuando el estado de la tecnologa
lo requiera.
Informacin descriptiva para la conservacin, consistente en otra informacin necesaria para la gestin y uso de los objetos a largo plazo, incluyendo identificadores
y detalles bibliogrficos, informacin sobre los propietarios del objeto, gestin de
derechos de acceso, historia, contexto incluyendo la relacin con otros objetos y la
informacin sobre la validacin de los formatos. Obviamente algunos de estos
metadatos pueden referirse a otros objetos tales como herramientas de software y
especificaciones de formatos que deben a su vez ser conservados. La naturaleza
interdependiente de los materiales digitales significa que los programas de
conservacin a menudo necesiten gestionar redes de objetos digitales enlazados
junto con sus metadatos.
An no existen estndares aceptados que definan esquemas de metadatos destinados
a la conservacin, por lo tanto las instituciones interesadas tendrn que elegir entre aceptar (y posiblemente adaptar) alguno de los modelos que estn siendo usados por otros o
bien disear un esquema propio (bien sea como una solucin completa de futuro o uno
intermedio de carcter mnimo hasta que surja alguna norma que lo sustituya).
Un problema aadido aqu est en que la creacin de metadatos no est suficientemente integrada en las herramientas de creacin de estos objetos para confiar solamente en el proceso de creacin. A medida que los proveedores de software comiencen a
incorporar XML y arquitecturas RDF (Resource Description Framwork) en sus procesadores de texto y bases de datos, la creacin de metadatos como parte integrante del proceso de creacin ser considerablemente ms fcil.
Preservacin de la tecnologa. Se basa en la preservacin del entorno tcnico que
hace funcionar el sistema, incluyendo sistemas operativos, software de aplicaciones
original, controladores de medios, etc. En cierta forma se trata ms de un tipo de
estrategia de recuperacin despus de un desastre de objetos digitales que no han
estado sometidos a una conservacin adecuada. Ofrece el potencial de tratar con la
obsolescencia de los soportes, asumiendo que esos soportes no se han deteriorado
ms all de su legibilidad. Puede aumentar el acceso a soportes y formatos de
ficheros obsoletos, pero en ltima instancia es un callejn sin salida, pues ninguna
tecnologa puede mantenerse funcional de forma indefinida. Esta estrategia no
puede ser llevada a cabo por una institucin a ttulo individual debido a los altos
costes que puede suponer tanto en equipamiento como en personal.
Migracin. Se utiliza para copiar o convertir datos desde una tecnologa a otra,
tanto si se trata de hardware como de software, conservando las caractersticas
esenciales de los datos. Esta definicin captura la esencia y la ambigedad de la
migracin. En algunas ocasiones se utiliza como sinnimo de actualizacin, pero
migracin representa un concepto mucho ms rico y amplio que actualizacin. Se
tratra de un conjunto de tareas organizadas destinadas a conseguir la transferencia
peridica de materiales digitales desde una generacin tecnolgica a la siguiente. El
propsito de la migracin es preservar la integridad de los objetos digitales y
mantener la posibilidad por parte de los usuarios de recuperar, visualizar y utilizarlos
en una perspectiva de constante cambio tecnolgico. La migracin incluye la
actualizacin como un medio de conservacin digital pero difiere de ella en el sentido de que no siempre es posible hacer una copia digital exacta de un objeto digital
cuando el hardware y el software cambian y adems deben mantener la compatibilidad del objeto con la nueva generacin de tecnologa. Si bien las empresas
desarrolladoras de software proporcionan estrategias de migracin o compatibilidad
hacia atrs para algunas generaciones de sus productos, esto puede no ser verdad
335
La naturaleza del medio fsico en el cual los datos digitales estn almacenados presenta uno de los mayores retos a la conservacin del contenido digital. A ello contribuye la
enorme variedad de tipos de soportes, su a menudo rpida obsolescencia y su vulnerabilidad ante la degradacin fsica. Un almacenamiento inadecuado suele ser la razn ms
habitual que provoque un fallo prematuro en los medios. La moderacin de la temperatura y la humedad son dos acciones que se sabe alargan la vida til de muchos soportes de
almacenamiento pero el sistema de conservacin de soportes debe tener las capacidades
adecuadas incluyendo:
Suficiente capacidad de almacenamiento. Aunque esta capacidad puede ser aadida en cualquier momento es importante tener en cuenta que el sistema debe tener
336
espacio suficiente para almacenar los datos previstos durante todo el ciclo de vida
de los mismos.
El sistema debe ser capaz de duplicar los datos a medida que sea requerido sin prdida de informacin y manteniendo la consistencia e integridad de los documentos,
as como transferir los datos a un nuevo soporte con las mismas condiciones.
Control de errores: algn nivel de control de errores es normal en todos los sistemas
informticos de almacenamiento. Dado que los documentos deben ser almacenados
por largos perodos y a menudo con muy poco uso por parte de personas, el sistema
debe ser capaz de detectar cambios o prdida de datos y tomar las acciones
apropiadas.
Las opciones disponibles en este momento de soportes a largo plazo incluyen:
Disco magntico: permite un acceso aleatorio a los datos, con posibilidad de modificarlos y una capacidad de almacenamiento superior a los 200 Gb y en
constante incremento. Su vida til estimada se sita en torno a los cinco aos.
Cinta magntica: el acceso a los datos es lineal con lo cual es ms lenta la bsqueda y localizacin de los mismos. En general no permite modificacin de los
datos, sino la reescritura de los mismos. La vida til y la capacidad de almacenamiento es similar a los discos magnticos.
Discos pticos (CD y DVD): permiten un acceso aleatorio y en algunos casos la modificacin de los datos. Su vida til es mayor que en los casos anteriores variando
desde los cinco a diez aos de los productos con menos calidad a varias dcadas
para los de mayor calidad.
Mantenimiento, soporte y programas de reemplazamiento. Los componentes del sistema deben ser reemplazados cada pocos aos. Los elementos de hardware
normalmente tienen una vida til de en torno a los cinco aos antes de que el soporte tcnico pueda ser difcil de obtener. Los soportes de almacenamiento tambin
necesitan una actualizacin regular (reescribir los datos) y un reemplazamiento peridico por nuevos soportes.
La necesidad de reemplazar los sistemas de almacenamiento implica costes recurrentes, que cubran el equipo propiamente dicho as como el proceso de transferencia de los datos que preceden y siguen a la instalacin de los equipos. Tales costes
deben ser tenidos en cuenta en los presupuestos a largo plazo.
Transferir los datos a nuevos soportes de forma peridica. Los sistemas de almacenamiento descansan en una segura y completa rplica de los datos ms que en
alargar la vida til de los soportes. Los datos deben ser copiados de soporte a
soporte para evitar el impacto del deterioro de los materiales. A medida que nuevos
tipos de soportes prueban su utilidad para el almacenamiento, los datos deben ser
transferidos desde los soportes ms antiguos. Esto debe realizarse antes de que los
componentes de hardware o software necesarios para acceder a los datos sean
retirados. La planificacin de la transferencia de los datos es un reto para la gestin
de la conservacin cualquiera que sea el sistema usado. Por ejemplo, un pequeo
archivo con una utilizacin limitada que almacena los datos en CD, debe mantener
un seguimiento de la edad y la situacin en que se encuentran los mismos, as como
tener presente que en algn momento la tecnologa de CD deber ser reemplazada
digamos, por ejemplo, por DVD.
Establecer condiciones de almacenamiento y manejo apropiadas. Los soportes de almacenamiento digital deben ser almacenados en condiciones que no aceleren su ritmo
de deterioro natural. El principal riesgo para los soportes es la excesiva humedad y
337
Como ya se ha sealado, el proceso de conservacin de objetos digitales afecta a todos los elementos presentes en el ciclo de vida de los mismos. Desde el punto de vista de
338
Como pasos iniciales para mantener el acceso se podra incluir mantener todo el
software necesario para garantizar el acceso as como cualquier software especializado. Esto no ser una estrategia efectiva a largo plazo pero puede ser
necesaria en el corto plazo.
Es importante tambin evaluar los materiales digitales, decidir por cuanto tiempo
deberan ser mantenidos y por quin de acuerdo con la poltica de la institucin.
KUNY, Terry, The digital dark ages? Challenges in the preservation of electronic information. International Preservation News, 1998, no. 17, (en lnea).
http://www.ifla.org/VI/4/news/17-98.htm#2 (Consulta: 26 de agosto de 2004).
UNESCO, Carta para la preservacin del patrimonio digital, 2003. (en lnea).
http://www.r020.com.ar/enlaces/ir.php?ir_id=665 (Consulta: 26 de agosto de 2004).
2
HODGE, Gail; CARROL, Bonnie C, Digital electronic archiving: the state of the art and the
state of the practice. International Council for Scientific and Technical Information, 1999.
(en lnea).
http://www.armamar.org/gwdc/GWDC_Digital_Electronic_Archiving_Report.htm (Consulta:
26 de agosto de 2004).
3
HODGE, Gail M, Best practices for digital archiving. Journal of Electronic Publishing. Vol .5,
no. 4. (en lnea) http://www.press.umich.edu/jep/05-04/hodge.html (Consulta: 28 de mayo
de 2004).
6
Reference Model for an Open Archiv al Information System (OAIS) (en lnea).
http://www.rlg.org/longterm/oais.html (Consulta: 26 de agosto de 2004).
7
340