Sunteți pe pagina 1din 17

DIRECTRICES PARA PROYECTOS DE

DIGITALIZACIÓN EN GALICIA

Biblioteca de Galicia
Marzo 2011
1. Introducción
Las presentes directrices básicas no pretenden ser un manual de digitalización sino simplemente un
instrumento para el trabajo en común y la coordinación de los proyectos que se están realizando o
se realicen en el futuro dentro del ámbito gallego. Se trata de un documento además adaptado a las
actuales características y panorama de las normativas y directrices nacionales e internacionales
vigentes para estos procesos, que requerirá de posteriores y previstas actualizaciones que permitan
adaptar su contenido a futuros desarrollos en el ámbito de aplicación de las mismas.

La existencia por lo demás de pautas y directrices ya publicadas y adoptadas en ámbitos nacionales


e internacionales, aconseja no establecer nuevas normativas que puedan divergir de los ámbitos
comunes ya comúnmente adoptados y establecidos. De esta forma el presente documento sigue y
respeta las directrices ya consolidadas, especialmente aquellas a las que nuestra comunidad y
especialmente la Biblioteca de Galicia ya lleva tiempo adaptándose, como son las "Directrices para
proyectos de digitalización de colecciones y fondos de dominio publico, en particular para aquellos
custodiados en bibliotecas y archivos" redactadas por un grupo de expertos de la IFLA y la
traducción al castellano la cual puede consultarse (en versión actualizada a 2 de julio de 2010) en
http://travesia.mcu.es/portalnb/jspui/bitstream/10421/3342/1/pautas_digitalizacion1.pdf
Así como las diferentes normativas o directrices técnicas surgidas de la participación de la
Biblioteca Dixital de Galicia (Galiciana) en el proyecto Europeana
http://version1.europeana.eu/web/europeana-project/technicaldocuments/
especialmente las siguientes recomendaciones:
Europenan Semantic Elements
http://version1.europeana.eu/c/document_library/get_file?uuid=a830cb84-9e71-41d6-9ca3-
cc36415d16f8&groupId=10602

Europeana Data Model http://version1.europeana.eu/c/document_library/get_file?uuid=aff89c92-


b6ff-4373-a279-fc47b9af3af2&groupId=10605

En el apéndice se señalan otros textos consultados y tenidos en cuenta para la redacción de estas
directrices o considerados de interés.
La función pues de esta publicación está, por un lado, en divulgar en nuestro ámbito una serie de
conceptos que consideramos tienen una básica importancia hacia el diseño de una política común,
tanto técnica como documental de digitalización de nuestro patrimonio bibliográfico y por otro,
concretar o desarrollar aquellos aspectos de esta política que puedan ser específicos de nuestra
comunidad.

Objetivos

En términos generales, las funciones o deseables objetivos de estas directrices serían:

 Normalizar en lo posible y necesario las características técnicas de la digitalización que faciliten el


intercambio de recursos, posibiliten las búsquedas integradas y simplifique el acceso libre y
gratuito a través de la web y para todo tipo de usuarios, a aquellos temas de interés para Galicia
que se encuentren libres de derechos o que los tengan cedidos o abiertos por sus detentadores.

 Coordinar los esfuerzos de forma que no se dupliquen trabajos e inversiones, rentabilizando en lo


posible los altos gastos que suponen los procesos de digitalización y creación de bibliotecas
digitales.

Se trata en cualquier caso de procesos tanto técnicos como normativos en constante evolución y
desarrollo. El presente documento pretende establecer objetivos a medio y largo plazo pero con la
constancia de que estos deben ser fijados de forma que puedan adaptarse al mismo tiempo a
posibles cambios o mejoras surgidos en el campo que abarcan estos procesos y a los elementos
constitutivos de los mismos. Deberán actualizarse asimismo con una periodicidad suficiente.

2. Proceso técnico

El proceso integral de digitalización

La digitalización como proceso documental asociado a la conservación y difusión del patrimonio


es un proceso en el que inciden tanto elementos de carácter informático, referidos especialmente a
las características técnicas del proceso y resultados de la digitalización en sí, como documentales,
que afectan a los datos (metadatos en la terminología actualmente en uso) que acompañamos a las
imágenes para facilitar su descripción y posterior recuperación por los usuarios de las bibliotecas
digitales.

Consideraciones previas

La digitalización es un proceso que debe estar precedido de un estudio suficientemente


fundamentado acerca de la conveniencia, rentabilidad y posibilidades del proyecto, y que solo en
caso de que los resultados así lo aconsejen debe asumirse su desarrollo. Algunos aspectos
fundamentales a tener en cuenta son:

 El coste del proceso de digitalización es alto y exige un laborioso trabajo de planificación,


ejecución y mantenimiento. Debe tenerse en cuenta adecuadamente el uso y demanda que va a
tener el resultado de la digitalización, y si la inversión a realizar se corresponde con el interés
presente o futuro de los materiales a exponer.

 Además de la inversión precisa para poner en marcha una biblioteca digital es importante prever
su sostenibilidad, por lo que debe contar con una previsión de mantenimiento.

 Es importante no duplicar esfuerzos con la digitalización de materiales ya accesible a través de la


red. Es esencial en ese sentido coordinar los esfuerzos y decisiones, especialmente en el campo de
las instituciones públicas, hacia la iniciación de un proyecto.

 Los múltiples beneficios de la digitalización deben ser tenidos en cuenta, especialmente los
derivados de su difusión y acceso fácil, generalizado y, en general, gratuito. La biblioteca digital
debe crearse con una idea clara de servicio a los usuarios a los que va dirigida. Debe facilitar su
acceso a través de normativas, especialmente las, que afectan su uso y accesibilidad facilitando
además su integración con otras ofertas similares en la red. No se puede olvidar tampoco el papel
educativo que puede jugar. También hay que tener en cuenta su papel en la preservación,
especialmente en el hecho de limitar (no necesariamente eliminar) el uso del material original. La
digitalización no es sin embargo la forma más barata ni con más garantías de preservación.

 Especialmente importante es el tema de los derechos de autor. No debemos olvidar que muchos de
los materiales bibliográficos y documentales susceptibles de digitalización y de difusión a través
de la red, están sujetos a derechos de autor, de copia o de otro tipo, que debemos respetar o
negociar de ser el caso
En el capítulo 1 de las "Directrices para Proyectos de Digitalización ..." de la IFLA se establecen
pautas para la toma de decisión hacia los posibles proyectos y para la selección de materiales a
digitalizar.

http://travesia.mcu.es/portalnb/jspui/bitstream/10421/3342/1/pautas_digitalizacion1.pdf

2.1 Características y requisitos técnicos de la conversión de las imágenes a formato electrónico

Características técnicas: consideraciones generales

Las "Directrices para Proyectos de Digitalización ..." de la IFLA definen la "imagen digital" como
una "fotografía electrónica" convertida en un conjunto de elementos pictóricos (pixeles) y
ordenada de acuerdo con una relación predefinida de columnas y filas.
Estas imágenes digitales son el resultado de la conversión, a través de escaners, de las imágenes
procedentes de los objetos o documentos originales, que son "capturadas" y convertidas en ficheros
a través del software normalmente incluido en los citados escaners.

En este proceso pueden utilizarse diferentes formatos de almacenamiento, y distintos niveles de


calidad, en función de la resolución, profundidad o compresión. Los elementos más importantes a
tener en cuenta son:

Formato: Los datos recogidos por el software del escáner, deben ser almacenados de acuerdo con
un formato, de los que existen en el mercado diferentes ofertas. Los más conocidos y utilizados
son TIFF, JPEG, GIF, PDF, etc. Algunos de ellos están pensados asimismo para compresión de las
imágenes.
El formato más usualmente requerido para imágenes de preservación sin comprensión en las
bibliotecas digitales es el TIFF ("Tagged Image File Format"), actualmente en su versión 6. En
este formato las imágenes pueden acompañarse con etiquetas que contienen información sobre las
mismas. Para imágenes de acceso se aconsejan sistemas de compresión sin pérdida. La Biblioteca
de Galicia está solicitando JPEG ("Joint Photographic Experts Group"). Actualmente se está
demandando también el JPEG2000, que permite trabajar con niveles de compresión mayores y que
está siendo aceptada como formato de preservación

Resolución: Indica el número de pixeles utilizados para representar la imagen, medidos en


proporción a una superficie determinada. Se utiliza la unidad ppp (pixeles por pulgada o puntos
por pulgada equivalentes a "ppi = pixeles per inch", o "dpi = dots per inch", respectivamente).
Cuantos más pixeles o puntos se utilicen para definir una pulgada de la imagen, más resolución
tendrá esta.
A mayor resolución la imagen tendrá más peso y también más coste de producción, por lo que es
importante considerar para cada material la resolución más adecuada. Para prensa no ilustrada, por
ejemplo, la resolución podrá ser menor que para cartografía, que precisa de mayor capacidad de
soportar ampliaciones.

Profundidad o definición: Indica el número de bits utilizado para representar cada píxel. Cuantos
más bits se utilicen mayor será el número de combinaciones posibles para representar colores o
escalas de grises. Un único bit solo permitiría representar el blanco y el negro, 8 bits permitirían
hasta 256 gamas de grises y 24 bits, hasta 16,7 millones de colores.
Lo mismo que con la resolución, cada tipo de material requiere una definición óptima que permita
explotar al máximo sus posibilidades de información y al mismo tiempo no desaproveche recursos
innecesarios. No se precisa una misma calidad para poder leer una página de prensa o de un libro
por Internet que para reproducir un cartel a color, un dibujo, grabado o una obra pictórica, ni para
contar con archivos que permitan una reproducción facsímil.

Tipo de color: blanco y negro, escala de grises o color, en relación también con la definición
escogida.

Compresión: Con el fin de reducir el peso de las imágenes, facilitando su almacenamiento y su


transmisión, hay desarrollados diversos programas que permiten la compresión (con alguna
pérdida o sin pérdida de calidad) de las imágenes digitalizadas.
Como norma general, y en relación con los citados valores técnicos en el proceso de digitalización
es conveniente la producción de dos diferentes tipos de archivo:
Un archivo de conservación o preservación, con mayor calidad (formato sin compresión, mayor
resolución y profundidad).
Un archivo para difusión a través de Internet, que permita su más fácil transmisión por la red, con
menor resolución y profundidad hasta donde sea factible, y en formatos comprimidos
preferentemente.

Requisitos técnicos: especificaciones de la Biblioteca de Galicia

Según el tipo de material y soporte y de la función de los mismos variarán los requisitos o
directrices concretas a tener en cuenta. A continuación se indican una serie de pautas que son en
estos momentos las que están demandándose tanto por la Biblioteca de Galicia como por diversas
instituciones, tanto nacionales como de fuera de España, especialmente aquellas de especial peso
en el campo de las bibliotecas digitales. No se presentan como normativa de obligado
cumplimiento, pero se aconsejan en líneas generales en cuanto conducen a la deseada
estandarización, y contribuyen a la buscada integración de recursos. Los datos, y especialmente la
resolución, se refieren siempre en relación al formato del original (100% de su tamaño).
En los anexos A y B se incluyen textos y enlaces a diferentes requisitos acerca de estos aspectos de
la digitalización.
Archivo de Archivo de difusión
Tipo de documento conservación JPEG, PDF1, GIF
TIFF 6

Resolución Definición Resolución Definición Compresión


Material textual: Mínimo 400 24 bits JPEG: 150 24 bits JPEG: baja
libro antiguo y ppp color ppp color GIF: estándar
moderno, GIF: 72 ppp
publicaciones
seriadas
Manuscritos Mínimo 400 24 bits JPEG: 150 24 bits JPEG: baja
ppp color ppp color GIF: estándar
GIF: 72 ppp
Mapas Mínimo 400 24 bits 300 ppp 24 bits Compresión
ppp color color baja
Aconsejable
500 ppp
Material gráfico: Mínimo 400 24 bits 300 ppp 24 bits Compresión
Fotografías, ppp color color baja
Grabados, Carteles, Aconsejable
Dibujos... 500 ppp
Microfilms Mínimo 400 24 bits 300 ppp 24 bits Compresión
ppp color color baja

Música: Mínimo 400 24 bits 300 ppp 24 bits Compresión


partituras, ppp color color baja
partituras anotadas,
manuscritos de
música

2.2. OCR (Reconocimiento Óptico de Caracteres)

Con cada imagen de texto deberá acompañarse un archivo asociado de texto legible por ordenador,
elaborado a través de un programa de OCR que deberá contar con los siguientes elementos para la
generación de los archivos OCR2:

1. Un archivo de texto OCR independiente por cada imagen de página.


2. Cada archivo de texto OCR se corresponderá con la imagen que representa.
3. Texto en set de caracteres UTF-8.
4. En el texto OCR no se deben recuperar elementos gráficos.
5. El texto OCR ordenado columna por columna (o sea en uno orden de lectura natural).
6. El archivo de texto OCR con cuadro delimitador de la coordenada de datos a nivel de
palabra.
7. El OCR deberá ser conforme con el esquema ALTO XML.
8. Todas las imágenes de páginas deberán estar acompañadas por un archivo ALTO XML que
contenga el texto reconocido.

1
O PDF adopta as características do formato original.
Estos ficheros se entregarán según el esquema ALTO XML. Analyzed Layout and Text Object es
un esquema XML que especifica los metadatos técnicos del diseño y contenido de recursos
textuales físicos, tales como páginas de un libro o periódico. Generalmente se usa como esquema
que extiende la sección de metadatos administrativos en Metafecha Encoding and Transmission
Schema (METS). Nembargantes, puede usarse ALTO independientemente de METS.
La vinculación entre los ficheros de imagen y texto se especificará en la sección correspondiente
del fichero METS que debe acompañar a cada obra digitalizada.

2.3. LOS METADATOS


Tan importante como el proceso de conversión de las imágenes a estructuras digitales es la
asignación de terminados datos a las mismas que permitan tanto su descripción como la posterior
recuperación a través de búsquedas.
La normalización de las normas o estándares aplicables a los objetos digitales, está sufriendo
importantes cambios, en una evolución que está conduciendo a nuevas estructuras de datos que
habitualmente se conocen como "metadatos".
Uno de los principales objetivos del plan de digitalización de la Biblioteca de Galicia es la de
integrar las colecciones, tanto propias como de otras bibliotecas digitales gallegas, de forma que a
través de una simple búsqueda pueda accederse a los fondos en conjunto de todas ellas. Al mismo
tiempo también se persigue que los instrumentos de búsqueda desde el exterior de Galicia puedan
acceder fácil y libremente a nuestros recursos y de forma suficientemente normalizada como para
ofrecer resultados ajustados a su interés.

Los nuevos desarrollos en el campo de descripción de los objetos digitales también permiten
nuevas formas de avanzar, como son la integración de objetos de diferente origen o final (archivos,
bibliotecas, museos y proyectos educativos institucionales y en línea), y asimismo la mejora
sustancial de los sistemas de descripción e investigación, desarrollada junto a la Web Semántica.
Se convierte, pues, necesario formular una coordinación aún mayor y la unificación en los casos en
que sea posible.

Actualmente son varios los estándares aplicables a los objetos digitales, no existiendo uno único
que recoja todos los ámbitos aplicables a la descripción de estas imágenes. Por esa razón se hace
preciso aplicar diferentes esquemas, que por lo demás actualmente se integran a través de
lenguajes como el XML en estructuras internacionalmente aceptadas como el de METS.
De entre todos los esquemas y recomendaciones relativos a metadatos existentes actualmente hay
varias normas que se están estableciendo como estándares más o menos aceptados de forma global
en el mundo de las bibliotecas digitales. La Biblioteca de Galicia en sus proyectos de digitalización
está adoptando estos estándares aceptados por la mayor parte de las bibliotecas digitales nacionales
e internacionales y son estos los que se proponen como pautas para proyectos a llevar a cabo en el
resto de Galicia.

Los esquemas de metadatos

Las actuales pautas de la Biblioteca de Galicia establecen como modelo de metadatos la entrega de
ficheros XML estructurados según el esquema Metafecha Encoding & Transmission Standard
(METS), actualmente en su versión 1.9.
http://www.loc.gov/standards/mets/METSPrimerRevised.pdf
METS es un esquema de metadatos desenvuelto por iniciativa de la Digital Library Federation y
mantenido por la "Network Development and MARC Standars Office" de la Biblioteca del
Congreso (LC) norteamericana (http://www.loc.gov/standards/mets/). Utiliza como lenguaje el
XML Schema do World Wide Web Consortium (W3C).
El METS aporta una metaestructura que contempla las diversas categorías de datos significativos
para una imagen digital y al mismo tiempo permite la integración dentro del propio registro o a
través de enlaces a archivos externos, de otros esquemas de metadatos.
Además de las recomendaciones generales para la utilización del esquema METS establecidas por
la "Network Development and MARC Standards Office" de la LOC, la Biblioteca de Galicia sigue
las recomendaciones particulares realizadas por el Ministerio de Cultura para el consumo y
preservación de recursos digitales3.

Los ficheros METS de la Biblioteca de Galicia se elaboran conforme a los siguientes perfiles
registrados en la "Network Development and MARC Standards Office" de la LOC y aprobados
por la METS Editorial Board:

Para Monografías: Model Paged Text Object Profile


http://www.loc.gov/standards/mets/profiles/00000005.html

Para Publicaciones Periódicas: METS Profile for Historical Newspapers


http://www.loc.gov/standards/mets/test/ndnp/00000010.html

Requisitos mínimos de los ficheros de metadatos establecidos por la Biblioteca de Galicia.

Siguiendo las normativas anteriormente señaladas, especialmente las definidas por la Subdirección
General de Coordinación Bibliotecaria del MCU, la Biblioteca de Galicia recomienda que los
archivos METS deben de tener, como mínimo, las siguientes secciones:

1.Etiqueta raíz (mets)


2. Cabecera (metsHdr)
3. Sección de metadatos decriptivos (dmdSec)
4. Sección de metadatos administrativos (amdSec)
5. Sección de archivos (fileSec)
6. Sección de mapa estructural (structMap)

1. Etiqueta raíz

En esta etiqueta, además de las menciones de namespaces y URIs necesarias, ha de incluirse un


atributo LABEL que va a identificar el archivo. El valor de dicho atributo será el título de la obra
(o las primeras palabras del título si este es muy largo). De ser el caso de que hubiera varios mets
con el mismo valor de este atributo LABEL (varios ejemplares de una obra o partes de una obra
...), se diferenciarán dichos valores de alguna manera, por ejemplo añadiendo un número de parte o
la firma del ejemplar.

Ejemplo de etiqueta raíz:


<mets ID="ID1" OBJID="1001287"
LABEL="Apertura de la Escuela Normal de la Provincia de Lugo"
PROFILE="http://www.loc.gov/standards/mets/profiles/00000005.html"
xmlns="http://www.loc.gov/METS/" xmlns:xlink="http://www.w3.org/1999/xlink"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns:marc="http://www.loc.gov/MARC21/slim"
xsi:schemaLocation=http://www.loc.gov/METS/ http://www.loc.gov/standards/mets/mets.xsd
http://www.loc.gov/MARC21/slim
http://www.loc.gov/standards/marcxml/schema/MARC21slim.xsd
http://www.loc.gov/mix/ http://www.loc.gov/standards/mix/mix02/mix02.xsd
http://cosimo.stanford.edu/sdr/metsrights/ http://cosimo.stanford.edu/sdr/metsrights.xsd
http://www.loc.gov/standards/premis/v2 http://www.loc.gov/standards/premis/v2/premis-v2-
0.xsd">

2. Cabecera (metsHdr)

En la cabecera ha de haber dos etiquetas < altRecordID > que nos servirán para asociar los grupos
de imágenes a los registros correspondientes:

a) Etiqueta < altRecordID > con atributo TYPE="Nº control". El valor del atributo TYPE será el
número de control o el código interno de identificación asignado al registro bibliográfico por la
organización que lo crea, utiliza o distribuye. Por ejemplo:
<mets:altRecordID TYPE="Nº control">PFB002201056</mets:altRecordID >

b) Etiqueta < altRecordID > con atributo TYPE="Institución y signatura". El valor del atributo
TYPE en este caso será el código de biblioteca (que en los registros debe aparecer en el campo 852
$a) y la signatura del ejemplar (que en los registros debe aparecer en el campo 852 $j). Ambos
valores deben estar separados por un espacio en blanco. Es importante que en los códigos de
biblioteca no haya espacios en blanco entre sus letras, eso produciría errores. Por ejemplo:

<mets:altRecordID TYPE="Institución e signatura"> C(S)-CBG BL10784 </mets:altRecordID>

Donde C(S)-CBG es el código de la biblioteca (que aparece en los registros en el 852 $a) y
BL10784 es la signatura del ejemplar (que aparece en los registros en el 852 $j). Cada ejemplar
debe tener su propia signatura, estas no deben repetirse.

Nota: de entregar sólo registros bibliográficos, en ellos estará el mencionado campo 852. Si se
entregaron registros independientes de ejemplar (de fondos) en ellos es donde deberá estar el
campo 852.
Para la asignación del código de la biblioteca se recomienda la utilización de la codificación
establecida para el Catálogo Colectivo del Patrimonio Bibliográfico.

3. Sección de metadatos descriptivos (dmdSec)

-Debe estar identificada por un atributo ID. Por ejemplo:


< mets:dmdSec ID="DMD001 ">
-Como requisito mínimo debe incluirse en esta sección de metadatos descriptivos el registro
bibliográfico en formato Marc21 XML.
http://www.loc.gov/standards/marcxml///
Puede añadirse además el registro de fondos cuando se disponga de él (en formato Marc21 XML
de fondos).
http://www.loc.gov/marc/holdings/echdspa.html

-Pueden incluirse además metadatos en otros formatos. Para la participación en proyectos europeos
es obligatorio la implementación del formato ESE en su versión 3.3.1 y en adelante lo será EDM
(Europeana Data Model).
Cuando el fichero de metadatos se corresponde con una publicación periódica se recomienda la
utilización del esquema MODS http://www.loc.gov/standards/mods/

4. Sección de metadatos administrativos (amdSec)

-En esta sección pueden incluirse metadatos PREMIS para preservación. La obtención de estos
metadatos se hará siguiendo el Diccionario de Datos PREMIS Versión 2.0.
http://www.bne.es/es/Micrositios/Guias/DiccionarioPremis/VERSION2.0/

5. Sección de archivos (fileSec)

En esta sección se relacionan y enumeran ordenadamente los archivos que van a ser o pudiesen ser
cargados.

 Debe haber una etiqueta < fileGrp > para cada una de las versiones del objeto digitalizado. Por
ejemplo, si se va a cargar una sola imagen o un solo grupo de imágenes habrá uno solo < fileGrp >,
si se pretende cargar la obra en varios formatos (por ejemplo jpg y pdf), habrá uno < fileGrp > para
cada formato de imajen.

 Los < fileGrp > deberán tener el atributo USE con los siguientes valores en función de los
diferentes formatos de imaxen del objeto digitalizado que representen:
Para las imágenes TIFF: < fileGrp USE= "archive">
Para las imágenes JPEG: < fileGrp USE= "reference">
Para las imágenes GIF: < fileGrp USE= "thumbnail">
Para las imágenes PDF: el suyo < fileGrp > no precisa del atributo USE
Será requisito mínimo obligatorio la existencia de uno < fileGrp > con el atributo USE con valor
"reference".

 Se anidarán dentro de cada < fileGrp > tantas etiquetas <file> como objetos pertenezcan al grupo.
Si se trata de un conjunto de imágenes jpg, habrá un <file> para cada imagen.

<file ID="FID0" MIMETYPE="image/jpeg" SEQ="1" OWNERID="11148168"


DMDID="DM1">
<FLocat LOCTYPE="URL" xlink:type="simple"
xlink:href="http://galiciana.bibliotecadegalicia.xunta.es/i18n/catalogo_imagenes/imagen_id.cmd?i
dImagen=11148168"/>
</file>
<file ID="FID1" MIMETYPE="image/jpeg" SEQ="2" OWNERID="11148169"
DMDID="DM1"> <FLocat LOCTYPE="URL" xlink:type="simple"
xlink:href="http://galiciana.bibliotecadegalicia.xunta.es/i18n/catalogo_imagenes/imagen_id.cmd?i
dImagen=11148169"/>
</file>

De tratarse de un solo pdf haberá un solo <file>

<mets:file MIMETYPE=" aplication/pdf " ID="FPID0">


<mets:FLocat LOCTYPE="URL" xlink:href="./alto/1918-1.pdf" />
</mets:file>
Cada una de estas etiquetas <file> ha de estar definida con un atributo ID. También se
acompañará de un atributo MIMETYPE con un valor que indique el formato del objeto
(image/jpg; aplication/pdf; image/tiff...).

Anidada en cada una de las etiquetas <file> ha de haber una etiqueta < FLocat > con los
siguiente atributos obligatorios LOCTYPE (con valor "URL") y xlink:href.

El valor del atributo xlink:href podrá ser:

a) Una dirección absoluta al objeto. Por ejemplo, si las imágenes se encuentran en un disco duro
externo, el valor de este atributo sería la dirección absoluta a la imagen correspondiente.

Por ejemplo: G://BdG/proxecto_dix_2010/img_0006.jpg


D:\Monografias\references\7\imagenes

b) Otra opción sería poner el texto file://($$SOPORTE1$$)/ antes del nombre de la carpeta
contenedora que contiene todos los grupos de imágenes (la carpeta con el nombre o código de la
biblioteca que contiene el resto de carpetas).

Por ejemplo: < file ID="FID5" MIMETYPE="image/jpeg" SEQ="1" DMDID="DM1 " >
< FLocat LOCTYPE="URL" xlink:type="simple" xlink:href="file://($$SOPORTE1$$)/NOVA
GALICIA reference/Nova galicia 16-17.0005.jpg"/>
</File>
Donde NUEVA GALICIA reference es el nombre de la carpeta contenedora.

6. Sección de mapa estructural (structMap)

Habrá tantos < strucMap > como estructuras se vayan a cargar. Si se va a cargar un grupo de
imágenes jpg por un lado y un pdf por otro, habrá dos mapas estructurales.

La etiqueta < strucMap > tiene de llevar el atributo TYPE con el valor "physical".

Ha de haber una primera etiqueta <div> que identifique la obra con el atributo TYPE (con valor
"libro, mapa ... "). Este primer <div> también ha de llevar un atributo LABEL con el mismo valor
que el atributo LABEL de la etiqueta raíz.

También ha de llevar un atributo ORDER, para indicar la orden del <div> dentro de este nivel de
anidamiento.

El resto de etiquetas <div> dependerán de la estructura de la obra que se está cargando. Deberán
incluirse los niveles de <div> necesarios para expresar esta estructura y en cada uno de estos <div>
deberán incluirse los atributos ORDER, para indicar el número de orden del objeto (mediante este
atributo se ordenan las imágenes) y LABEL, que es el texto que se va a visualizar asociado al
objeto, por ejemplo un número de página o de capítulo ...

A cada objeto particular (imagen jpg, pdf, tiff ...) le corresponderá una etiqueta <fptr> con el
atributo obligatorio FILEID. El valor de este atributo será igual al valor del atributo ID de la
etiqueta <file> (de la sección de archivo) correspondiente a dicho objeto digital. Esta relación es
indispensable para que la aplicación sepa qué imagen de las enumeradas en la sección de archivo
corresponde a cada parte de la estructura.
Cada una de estas etiquetas <fptr> estará anidada en una etiqueta <div> donde se indicara
mediante los atributos ORDER y LABEL, la orden del objeto respecto a sus hermanos y el texto
que se visualizará asociado a dicho objeto (por ejemplo, el número de página).

<mets:structMap ID="SM1" TYPE="PHYSICAL">


<mets:div ORDER="1" LABEL="NOVA GALICIA" TYPE="book">
<mets:div ORDER="1" LABEL="[CUBIERTA]" TYPE="page">
<mets:fptr FILEID="FMID1"/>
<mets:fptr FILEID="FRID20"/>
</mets:div>
<mets:div ORDER="2" LABEL=" " TYPE="page">
<mets:fptr FILEID="FMID2"/>
<mets:fptr FILEID="FRID21"/>
</mets:div>
<mets:div ORDER="3" LABEL=" " TYPE="page">
<mets:fptr FILEID="FMID3"/>
<mets:fptr FILEID="FRID22"/>
</mets:div>
<mets:div ORDER="4" LABEL=" " TYPE="page">
<mets:fptr FILEID="FMID4"/>
<mets:fptr FILEID="FRID23"/>
</mets:div>
...
</mets:structMap>
<mets:structMap ID="SM2" TYPE="PHYSICAL">
<mets:div ORDER="1" LABEL="NOVA GALICIA " TYPE="book">
<mets:div ORDER="1" LABEL="NOVA GALICIA " TYPE="page">
<mets:fptr FILEID="FRID38"/>
</mets:div>
</mets:div>
</mets:structMap>

Encarpetado de las imágenes y de los ficheros METS

La Biblioteca de Galicia recomienda que los resultados de los proyectos de digitalización se


encarpeten según el siguiente esquema:
- Se creará una carpeta por cada formato de imagen resultante de la digitalización (TIFF, JPEG,
GIF, PDF).
- Dentro de cada una de esas carpetas se crearán tantas carpetas como obras digitalizadas objeto de
ese proyecto. Dichas carpetas se identificarán mediante el código de la biblioteca y signatura de la
obra. Cada una de ellas contendrá todas las imágenes de esa obra.
- Los archivos METS deberán agruparse en una carpeta independiente.

Autoridades

De igual modo, se entregará un fichero XML estructurado según el esquema MADS en el que se
detallarán los registros de autoridades correspondientes a cada publicación (personas, entidades y
títulos), con todas las variantes y referencias que puedan desprenderse de la catalogación completa
de la totalidad del ejemplar disponible. Con estos ficheros XML MADS se constituirá el fichero de
autoridades de la Biblioteca de Galicia.

Repositorios digitales: Protocolo OAI-PMH y Directrices DRIVER / OpenAire para proveedores


de contenidos

Desde octubre del año 2008 la Biblioteca de Galicia mantiene en funcionamiento "Galiciana",
repositorio OAI accesible en la dirección http://www.galiciana.bibliotecadegalicia.xunta.es.
Este repositorio permite recolectar registros mediante el Protocolo OAI-PMH versión 2.0. Sus
registros están codificados como mínimo en Dublin Core sin calificar, aunque Galiciana trabaja
con casi todos los esquemas de metadatos más utilizados actualmente (OAI_MARC, OAI_DC,
MARC 21, ESE y DIDL).
Hoy en día el repositorio de Galiciana es proveedor de datos en los principales proyectos de
agregadores de contenidos de bases de datos de colecciones digitales a nivel estatal (HISPANA),
europeo (EUROPEANA) y mundial (OAISTER). También está presente en los principales
registros internacionales de proveedores de datos como "Registry of Open Access Repositories
(ROAR)". Todo eslabón es posible ya que Galiciana cumple con las principales directrices y
protocolos de interoperabilidad vigentes actualmente.

Protocolo OAI-PMH versión 2.0.

La formulación esencial de los archivos abiertos es permitir el acceso a los materiales en la web
por medio de repositorios que, interoperando unos con otros, permitan el intercambio de
metadatos, su almacenamiento y publicación. Persiguiendo este objetivo "la Open Archives
Initiative desarrolla y promueve normas de interoperabilidad que tienen por objeto facilitar la
difusión eficaz de los contenidos".
El Protocolo OAI para la Recolección de Metadatos (OAI-PMH), define un mecanismo para la
recolección de registros que contienen los metadatos de los repositorios. El OAI-PMH ofrece a los
Proveedores de Datos una opción técnica sencilla para poner sus metadatos a disposición de
servicios basados en los estándares abiertos HTTP (Hypertext Transport Protocol) y XML
(Extensible Markup Language). Los metadatos que son reunidos pueden estar en cualquier formato
establecido por una comunidad (o por cualquier conjunto específico de Proveedores de Datos y
Proveedores de Servicios), con independencia de que establecieran el Dublin Core no cualificado
para proporcionar un nivel básico de interoperabilidad.

Directrices DRIVER

DRIVER, "Dixital Repository Infrastructure Vision fuera European Research" (Visión de


infraestructura de repositorios digitales para la investigación europea), es un proyecto realizado por
un consorcio financiado por la Unión Europea que está creando un marco de trabajo tecnológico y
organizativo para implementar una capa paneuropea de datos, que permita el uso avanzado de los
recursos de contenido en el ámbito de la investigación y la educación superior. DRIVER desarrolla
una infraestructura de servicios y una infraestructura de datos. Ambas están concebidas para
orquestar los recursos y los servicios existentes en la red de repositorios.

Directrices OpenAire 1.1

Las Directrices OpenAIRE 1.0, orientarán los administradores de repositorios para definir e
implementar sus políticas locales de administración de datos cumpliendo con las demandas de la
Comisión Europea sobre Acceso Abierto. Además, cumplirán con los requisitos técnicos de la
infraestructura de OpenAIRE, diseñada para soportar y monitorizar la implementación del piloto
7PM OA1.
Al implementar estas Directrices para administradores de repositorios, se facilita a los autores que
depositan sus publicaciones en el repositorio cumplir con los requisitos de la CE sobre Acceso
Abierto.
Para desarrolladores de software de repositorios, las Directrices son una guía para añadir en futuras
versiones del software, funcionalidades que ayuden a los autores con financiación de la CE para
sus investigaciones.
ANEXO A

Relación de directrices y normativas propuestas y consultadas

Guidelines for preparing your historical newspapers for online acces.


http://www.oclc.org/services/brochures/212553usf_contentdm_guidelines_historical_newspapers.p
df
CDL (California Digital Library) Guidelines for Digital Objects.
http://www.cdlib.org/inside/diglib/guidelines/
http://www.cdlib.org/inside/diglib/guidelines/bpgimages/
Estándares de digitalización. Elementos mínimos. Propuesta del Consorcio de Bibliotecas
Universitarias de Catalunya (actualización octubre 2010).
http://www.recercat.net/bitstream/2072/97497/3/1010EstandardsRequerimentsMinims_Public_spa.
pdf
Framework of Guidance for Building Good Digital Collections. 3ª ed. 2007. (Edición electrónica
2008)
http://www.niso.org/publications/rp/framework3.pdf
“Directrices para proyectos de digitalización de colecciones y fondos de dominio publico, en
particular para aquellos custodiados en bibliotecas y archivos”
http://hdl.handle.net/10421/3342
http://travesia.mcu.es/portalnb/jspui/bitstream/10421/3342/1/PAUTASDIGIT010052011.pdf
Europeana
http://version1.europeana.eu/web/europeana-project/technicaldocuments/
Europenan Semantic Elements
http://hdl.handle.net/10421/2403
http://version1.europeana.eu/c/document_library/get_file?uuid=a830cb84-9e71-41d6-9ca3-
cc36415d16f8&groupId=10602
Europeana Data Model
http://hdl.handle.net/10421/3861
http://version1.europeana.eu/c/document_library/get_file?uuid=aff89c92-b6ff-4373-a279-
fc47b9af3af2&groupId=10605
National Digital Newspaper Program
http://www.neh.gov/grants/guidelines/ndnp.html
The National Digital Newspaper Program (NDNP).Technical Guidelines for Applicants (2009).
http://www.loc.gov/ndnp/guidelines/archive/NDNP_201113TechNotes.pdf

Network Development and MARC Standars Office – Library of Congress


http://www.loc.gov/standards/mets/
Metadata Encoding & Transmission Standard (METS), actualmente na súa versión 1.9.
http://www.loc.gov/standards/mets/METSPrimerRevised.pdf
Technical Metadata for Optical Character Recognition: Analyzed Layout and Text Object (ALTO)
http://www.loc.gov/standards/alto/
Model Paged Text Object Profile
http://www.loc.gov/standards/mets/profiles/00000005.html
METS Profile for Historical Newspapers
http://www.loc.gov/standards/mets/test/ndnp/00000010.html
Formato Marc21 XML.
http://www.loc.gov/standards/marcxml///
Formato Marc21 XML de fondos.
http://www.loc.gov/marc/holdings/echdspa.html
Esquema MODS
http://www.loc.gov/standards/mods/
The Dublin Core Metadata Initiative (DCMI)
http://dublincore.org/
Diccionario de Datos PREMIS Versión 2.0.
http://www.bne.es/es/Micrositios/Guias/DiccionarioPremis/VERSION2.0/
The Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH).
Protocol Version 2.0
http://www.openarchives.org/OAI/openarchivesprotocol.html
OAI para principiantes - tutorial en línea del Open Archives Forum
http://hdl.handle.net/10421/1823
http://travesia.mcu.es/portalnb/jspui/html/10421/1823/intro.htm
Open Archives Initiative - Object Reuse and Exchange (OAI-ORE)
http://www.openarchives.org/ore/

Directrices DRIVER 2.0. Directrices para proveedores de contenido - Exposición de recursos


textuales con el protocolo OAIPMH [Noviembre 2008].
http://www.driver-support.eu/documents/DRIVER_2_0_Guidelines_Spanish.pdf 12
Directrices OpenAire 1.1
http://www.recolecta.net/buscador/documentos/OpenAIRE-Guidelines_v1-1_es.pdf
Digitisation guidelines – Nacional Library of Australia
http://www.nla.gov.au/digital/standards.html
Manual de Autoridades. Biblioteca Nacional de España (2010)
http://www.bne.es/es/Micrositios/Guias/Autoridades/resources/docs/Manual_de_Autoridades.pdf
Resource Description and Access (RDA) (oct. 2009)
http://hdl.handle.net/10421/1561
http://www.rda-jsc.org/rda.html

S-ar putea să vă placă și