Documente Academic
Documente Profesional
Documente Cultură
antiguos
Los archivos envejecen, y envejecen muy mal. Mientras que
un documento de papel se puede leer mientras siga intacto,
un archivo incompatible...
Fabrizio Ferri-Benedetti |
10 de mayo del 2013
Utilidades
Nivel Avanzado
Windows
Mac
Linux
Los archivos envejecen, y envejecen muy mal. Mientras que un documento de papel se puede
leer mientras siga intacto, un archivo incompatible o corrupto nada dice acerca de sus
contenidos, al menos no hasta que apliques algunas tcnicas de recuperacin de datos y
arqueologa informtica.
Busca ese viejo disquete que guardas en el cajn. O aquel disco duro antiguo. O incluso una de
esas viejas cintas en las que solas hacer las copias de seguridad. Si consigues acceder a sus
carpetas, la probabilidad de que te encuentres con archivos que eres incapaz de abrir es muy
alta.
Voy a explicarte cules son las razones ms habituales por las que los archivos antiguos son tan
difciles de abrir y qu puedes hacer para rescatar su contenido total o parcialmente. Ya
vers que para ser un arquelogo digital no hace falta ltigo ni tampoco sombrero, pero s algo de
paciencia y habilidad.
Estas "gramticas" que permiten leer e interpretar el contenido de una archivo se detallan en las
especificaciones de formato, documentos tcnicos que pueden ser de pblico dominio o bien
propietarios y, a veces, confidenciales. Por ejemplo, el formato de imagen de Adobe Photoshop,
el conocido .PSD, se detalla aqu para todo el mundo.
Abrir hoy un documento creado con el procesador de textos Lotus Ami Pro puede ser
complicado
Otros problemas surgen cuando el archivo est corrupto (parte de sus datos se han perdido o
daado) o comprimido en un formato a su vez desconocido. El cifrado, finalmente, acaba por
convertir carpetas enteras en cajas de seguridad cuya llave ha sido tirada al mar.
IsoBuster, capaz de leer todo tipo de unidades y crear imgenes ISO (recomendada)
Unstoppable Copier, una utilidad para copiar archivos ignorando los errores de lectura
El comando dd de Linux y Unix, muy potente para leer datos en bruto (para Windows,
WinDD)
OSFClone, una herramienta arrancable que clona discos enteros (y OSFMount para
leerlos)
Si no quieres trabajar con imgenes, puedes usar las operaciones de copia clsicas del sistema
operativo, pero puede que fallen en caso de errores de lectura. En Windows, utilidades de
copiado fiables son Teracopy y SuperCopier.
IsoBuster en accin. A diferencia del copiado normal, el suyo puede con los errores
Para ver un ejemplo de cmo usar IsoBuster para leer un CD/DVD daado, lee mi tutorial de
recuperacin. El procedimiento es similar al de otras utilidades grficas. El objetivo final es que
consigas tener una copia fiel de los archivos a examinar.
La ficha de FileInfo sobre el formato .SAM. La pgina te indica tambin qu programas pueden
abrirlo
Pero qu ocurre si el archivo no tiene extensin o si la bsqueda no arroja resultados? En ese
caso, debes analizar el archivo. Este mtodo no siempre arroja una alta precisin, pero da pistas
muy tiles sobre el contenido del archivo.
Hay una herramienta digna de CSI que hace ese trabajo de anlisis por ti. Se llama TrID, y
gracias a su amplia base de datos de firmas y cabeceras es capaz de identificar ms de 5.000
formatos. Y es una base de datos en constante crecimiento.
Al parecer el archivo es casi seguramente una base de datos con imgenes en su interior
Una opcin todava ms rpida y completa? Si el archivo tiene un tamao inferior a los 10
megabytes, puedes subirlo a VirusTotal, que no solo lo escanear en busca de malware, sino que
adems analizar su formato con TrID.
Sabias que VirusTotal tambin analiza el formato del archivo y sus metadatos?
Ahora bien, conocer el formato es solo la mitad del trabajo. Una vez que lo conoces, debes
encontrar el programa capaz de abrirlo. Una rpida bsqueda en FileInfo o FileExt -o en
Google- te dir con qu aplicacin puedes intentarlo.
Mi consejo es que uses DOSBox para ejecutar esas aplicaciones antiguas. Es un emulador eficaz
y muy fcil de configurar (aqu te lo explico). En contra de la creencia popular, DOSBox no solo
sirve para juegos, sino tambin para aplicaciones estndar.
Necesitas una emulacin ms completa, quiz de otro sistema operativo? En ese caso, lo mejor
que puedes hacer es configurar una mquina virtual, que no es ms que un PC virtual dentro
de tu PC. La que recomiendo es VirtualBox.
En este magnfico tutorial, Fede Diaz explica cmo instalar MS-DOS 6.22 y Windows 3.11 en
VirtualBox
Caso 2: tienes el programa, debera ejecutarse, pero... no lo hace
Aun tenindolo todo configurado a las mil maravillas -al menos tericamente-, el Universo
puede conspirar contra ti para que el programa que deba abrir tus documentos no consiga...
abrirse.
Miles de personas se han enfrentado a tu problema antes, y quiz lo hayan resuelto (captura de
GMayor)
Otra cosa que puedes intentar es buscar plugins o accesorios compatibles. Por ejemplo, si lo
que tienes que abrir es un documento de texto, busca un plugin para un editor que tengas, o una
versin anterior que s es capaz de abrir el archivo.
Caso 4: tienes el programa y funciona, pero el archivo no se abre
Hay muchas razones por las que un archivo no pueda abrirse correctamente en su programa.
Entre las ms habituales:
1. Ha sido dividido en segmentos (por ejemplo, con un programa tipo Hacha o HJ-Split)
2. El contenido est comprimido o protegido por una clave desconocida (cifrado)
3. El archivo tiene una extensin errnea o varias extensiones mezcladas
4. Su contenido ha sido sobrescrito, borrado, corrompido o infectado con virus
En los dos primeros casos, debes prestar atencin al contexto del archivo: hay instrucciones
en la carpeta? Ha dejado alguien una clave? Hay archivos con el mismo nombre que pudieran
ser segmentos?
El caso 3 es fcil de resolver: solo requiere que vuelvas a analizar el archivo y cambies la
extensin, o incluso que la dejes vaca y dejes que el programa intente adivinar el formato
forzndolo a abrir un archivo desconocido.
El cuarto caso es el ms peliagudo. Si el archivo ha perdido su integridad, su apertura de poco
te podr servir (a menos que el programa empleado sea muy tolerante a los errores). Lo que nos
lleva al punto 4 de este artculo.
La extraccin de datos implica casi siempre una lectura de bajo nivel similar a la que efectan
los recuperadores de archivos borrados. En algunos casos, sobre todo para recuperar texto,
tendrs que usar un editor hexadecimal.
Hay formatos son ms tolerantes con los errores que otros. A mayor compresin de datos, peor
recuperacin
Forzar la apertura con visualizadores rara vez funciona, sobre todo si los archivos tienen algn
tipo de compresin (como muchos vdeos y archivos de sonido). Los formatos ms
recuperables tienen una estructura simple (como WAV o BMP).
Un editor hexadecimal, como HxD o WinHex, te ayudar en la ardua tarea de recuperar datos.
Basta con abrir cualquier archivo para poder buscar cadenas de texto en su interior y copiarlas
luego al portapapeles.
HxD ha encontrado texto, en este caso dentro de un procesos en la memoria. Exportarlo es muy
fcil
Con algo de suerte, las generaciones futuras podrn acceder todava a tus documentos y
leerlos sin necesidad de acudir a laboratorios de arqueologa digital o centros de preservacin de
documentos.