Sunteți pe pagina 1din 144

Los metadatos en las

bibliotecas universitarias
Universidad de Burgos
28-29 de octubre de 2005

Manuela Palafox Parejo


Servicio de Tecnologas de la Informacin y Sistemas Bibliotecarios
Biblioteca de la Universidad Complutense de Madrid

ndice

Metadatos. Concepto, desarrollo y tendencias


Esquemas de metadatos
Portales temticos
El movimiento Open Access
Open Access Initiative (OAI-PMH)
Los archivos institucionales OAI

Empezamos con la bibliografa bsica


Coplan, Priscilla. Metadata Fundamentals for all
librarians. American Library Association, 2003
Mndez Rodrguez, Eva Mara. Metadatos y recuperacin
de informacin : estndares, problemas y aplicabilidad en
bibliotecas digitales. Trea, 2002
Dublin Core Metadata Initiative (DCMI).
http://dublincore.org
Open Archives Initiative (OAI).
http://www.openarchives.org/
Library of Congress. Standars.
http://www.loc.gov/standards/

La situacin durante la dcada de los 90


Proliferacin de distintos esquemas de metadatos.
En los buscadores encontrbamos muchas
referencias y muy poca precisin en las
bsquedas.
Haba una gran volatilidad de los recursos de
Internet: recursos que desaparecan o cambiaban
de direccin.
Haba un crecimiento exponencial de tipos de
recursos disponibles.

Los metadatos
El concepto de metadatos es anterior a Internet y a
la Web. El trmino fue acuado en el mbito de la
Informtica durante la dcada de los 60. Hoy, se
ha incrementado su inters con el desarrollo de la
publicacin electrnica y las bibliotecas digitales.
Los metadatos se introdujeron en el vocabulario
de la Biblioteconoma en 1995, en el 1 Seminario
de Dublin Core (celebrado en Dublin, Ohio,
EEUU).

El concepto de metadatos
No existe un consenso conceptual sobre el trmino
de metadatos, es diferente segn el colectivo que
los utiliza:
o Informticos: entienden los metadatos a nivel fsico
(nombres de ficheros, formatos, tipos de datos...)
o Gestores de bases de datos: entienden los metadatos
nombres de los objetos de una base de datos, atributos,
relaciones, etc.
o Bibliotecarios: consideran que los metadatos son datos
sobre el contenido, la estructura, la representacin y el
contexto de un conjunto de datos concreto.

El trmino metadatos
Hay dos tendencias en el uso de los metadatos
dentro de la comunidad de bibliotecarios:
o Los llamados generalistas que usan el trmino
metadatos para referirse a la descripcin de recursos
digitales y no digitales.
o Mientras los restrictivos que limitan su uso al mbito
de los recursos electrnicos distribuidos por la Web.

Definiciones de metadatos
La definicin de metadatos ms extendida es datos sobre
otros datos. Etimolgicamente, el trmino metadato/s
procede del prefijo griego meta, que significa algo que
transciende, que va ms all.
Eva Mndez y Jos A. Senso definen los metadatos,
incidiendo en su funcionalidad, como toda aquella
informacin descriptiva sobre el contexto, calidad,
condicin o caractersticas de un recurso, dato u objeto
que tienen la finalidad de facilitar su recuperacin,
autentificacin, evaluacin, preservacin y/o
interoperatividad.

Ms definiciones de metadatos
Los metadatos se definen como informacin estructurada
sobre un recurso de informacin de cualquier tipo o
formato (P. Caplan).
Segn Ukoln, los metadatos son datos estructurados sobre
recursos digitales (y no digitales) que pueden ser utilizados
como ayuda en un amplio rango de operaciones. Por
ejemplo, en la descripcin y localizacin de recursos, en la
gestin de los recursos de informacin, incluida la gestin
de derechos de propiedad intelectual y en su preservacin a
largo plazo. (http://www.ukoln.ac.uk/metadata)

Ejemplos de metadatos
Los registros del catlogo de la biblioteca.
El resumen de un documento.
Las palabras clave extradas de un texto

Para qu sirven los metadatos?


-

Para localizar recursos


Para describir recursos
Para controlar el acceso a los recursos
Para identificar versiones
Para preservar la informacin

Aplicacin de los metadatos.1


Para el sistema, los metadatos:
o Facilitan la interoperatividad entre las herramientas de
bsqueda.
o Permiten gestionar los recursos, definiendo relaciones y
estructuras de los componentes, as como los modos de
acceso. De ah su empleo en dominios distintos: gestin
de bibliotecas digitales, comercio electrnico,
preservacin...

Aplicacin de los metadatos. 2


Para el usuario cumple dos funciones:
o Posibilitar el acceso a la informacin, con los
metadatos puede localizar o descubrir un determinado
recurso (los metadatos asociados a una imagen).
o Evaluar la utilidad o relevancia de un recurso. Con los
metadatos asociados a un recurso puede conocer la
responsabilidad intelectual, el tipo de documento,
derechos de propiedad, condiciones de acceso, etc.

Tipos de metadatos. 1
Segn el dominio de aplicacin:
o Recursos web de portales temticos: Dublin Core
o Registros catalogrficos en catlogos de bibliotecas:
MARC
o Objetos de museos: CIMI (Consortium for the
Interchange Museum Information)
o Recursos geogrficos y geoespaciales (CSDGM)
o Recursos de administraciones pblicas (GILS)
o Recursos de archivos (EAD) .....

Tipos de metadatos. 2
Segn el ciclo de vida de los recursos:
o Metadatos descriptivos
o Metadatos administrativos
o De gestin de derechos
o De preservacin
o De tipo tcnico

Metadatos descriptivos
Los metadatos descriptivos tienen como objetivo
la localizacin (como se encuentra un recurso), la
identificacin (cmo se distingue un recurso de
otro) y la seleccin (cmo determinar que un
recurso cumple una necesidad particular).
Otras funciones de los metadatos descriptivos
incluyen la evaluacin, relaciones y usabilidad.

Metadatos administrativos
Loas metadatos administrativos contienen informacin
para facilitar la gestin de los recursos: cuando fue creado
un recurso, quin es el responsable de controlar el acceso o
archivar el contenido, cules son las restricciones sobre el
acceso, distintas versiones, uso de los recursos, relativos al
nivel de utilizacin.
La categora de metadatos administrativos puede
subdividirse en metadatos de gestin de derechos,
metadatos de preservacin (actualizacin de los datos,
migracin de los contenidos...) y metadatos de tipo tcnico
(informan sobre el funcionamiento del sistema, de los
requisitos de hardware y software...)

Tipos de metadatos. 3
Segn la complejidad estructural:
o Metadatos desestructurados: los metadatos generados
automticamente por los robots a partir del texto en
HTML y de algunas etiquetas como <title>, <meta>...
o Metadatos semiestructurados: para estructuras
semnticas sencillas, como Dublin Core
o Metadatos estructurados: MARC

Esquemas de metadatos. 1
Un esquema de metadatos es un conjunto de campos, junto con sus
reglas de uso y una sintaxis, concebido para un propsito concreto.
Existe una amplia variedad de esquemas de metadatos, dependiendo
de los objetivos y caractersticas de los distintos proyectos :
o Metadatos de propsito general, dirigidos a describir cualquier
tipo de informacin digital. Por ejemplo, el esquema Dublin Core
o METS (Metadata Encoding and Transmission Standard).
o Metadatos de propsito especfico, vinculados a un campo
temtico en particular como el esquema EAD (Encoded Archival
Description) que se emplea para describir informacin de archivo
o el modelo TEI-Header (Text Encoding Iniciative) para describir
informacin textual en el rea de las Humanidades, etc.

Esquemas de metadatos. 2
Caractersticas de un esquema de metadatos:
o Semntica: alude al significado de los campos, su carcter
obligatorio, si puede ser repetible
o Reglas de contenido: prescriben cmo seleccionar y representar
los valores de un campo.
o Sintaxis: fija la codificacin de los campos del esquema en la
mquina, para ofrecer un formato de intercambio.
Ejemplo:
o El esquema MARC es un compuesto de diferentes normas:
ISO2709, MARC21, Anglo-American Cataloguing Rules, ISBD.
o Clases de elementos MARC: campos, indicadores y subcampos
o ISO 2709 no asigna significados a estos elementos, quien lo hace
es MARC21

Metadatos y lenguajes de marcado


Clases de marcado:
o Marcas de procesamiento: orientadas a la presentacin
de la informacin (HTML)
o Marcas descriptivas: identifican los elementos
estructurales de un texto, determinando su estructura
lgica o infraestructura del contenido documental
(XML)

Lenguaje de marcas XML


Hereda la misma estructura que SGML (elementos, atributos).
Se puede emplear mediante dos herramientas: DTDs o Esquemas (que
tienen sintaxis xml).
Gestiona espacios de nombre (namespaces).
Puede visualizarse en navegadores empleando XLS.
Ventajas:
o Gestiona informacin jerrquica (ej: todos los documentos de una pgina
web en un mismo registro estructurado).
o Integra informacin textual y multimedia (ej: un documento con texto,
sonido e imagen)
o Permite el intercambio entre esquemas (crosswalks)
o Los datos estn en formato ascii, lo que facilita el intercambio de
informacin entre aplicaciones.

Evolucin de los metadatos: de las sintaxis


cerradas a las sintaxis abiertas
Sintaxis ISO 2709 para MARC21

Metadatos - ISO 2709 (estructura)


Cabecera (24)
Directorio (variable)
-Etiqueta:1- 3
-Long Campo:4-7
-Comienzo:8-12

Campos de datos

Metadatos- Dublin Core/Metaetiquetas HTML.1


- La sintaxis DC en HTML utiliza las etiquetas
<META>
- <META name=valor content=valor>
- Name especifica la propiedad y Content el valor
de la propiedad. Carecen de valores fijados, por lo
que se utilizan como spamming con fines de
promocin.

Metadatos- Dublin Core/Metaetiquetas HTML. 2


- Ejemplo:
<META name: DC.type content=text data>
<META name: DC. language content=spa>
<META name: DC. creator content=Castell, Manuel>
<META name: DC. date content=2001>
<META name: DC. title content=La galaxia Internet >
<META name: DC. creator content=Manuel Castells>
<META name: DC. publisher content=Barcelona>
<META name: DC. publisher content=Plaza y Jans>
<META name: DC. subject content=Internet -- Aspectos sociales>

Metadatos- Dublin Core/XML-RDF


<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.0/"
xmlns:dcq="http://purl.org/dc/qualifiers/1.0/">
<rdf:Description>
<dc:type>Text Data</dc:type>
<dc:language>spa</dc:language>
<dc:creator>Castells, Manuel, 1942-</dc:creator>
<dc:title>La galaxia Internet / Manuel Castells</dc:title>
<dc:publisher>Barcelona :</dc:publisher>
<dc:publisher>Plaza y Jans, </dc:publisher>
<dc:date>2001</dc:date>
<dc:description>Incluye ndices</dc:description>
<dc:subject>Internet -- Aspectos sociales</dc:subject>
<dc:subject>Globalizacin</dc:subject>
</rdf:Description>
</rdf:RDF>++

Metadatos MODS

MODS (Metadata Object and Description Schema) es un esquema de


metadatos descriptivo compatible con MARC y con sintaxis XML.
Propsito: superar las insuficiencias de MARC. El esquema MODS
traslada a XML los metadatos MARC.
Hereda la semntica de MARC.
Los campos numricos de MARC han sido sustituidos por campos de
texto.
Conversin o mapping entre MARC-MODS.
http://www.loc.gov/standards/mods/mods-mapping.html)

Metadatos METS

METS significa Metadata Encoding and Transmisin Standard


Es una norma convergente e integradora, destinada a describir,
transmitir y gestionar recursos digitales.
Surge en el seno de la Digital Library Federation( DLF) como
respuesta al modelo gestin de depsitos de recursos digitales OAIS.
Permite un gestin integral y jerrquica de manifestaciones de una
misma obra: texto, grabacin sonora y vdeo de una conferencia.
Esquema XML que empaqueta todos los metadatos asociados con un
recurso digital (descriptivos, administrativos, estructurales necesarios
para recuperar, preservar y ofrecer recursos digitales).

Metadatos METS
Partes de un registro METS:
o Cabecera: informa del doc METS mismo (identificadores, fecha de
creacin, actualizaciones y status)
o Metadatos descriptivos: admite esquemas DC, MARCXML y
MODS
o Metadatos administrativos para difusin y preservacin
o Seccin de ficheros: identifica la totalidad de ficheros que
componen el objeto
o Mapa estructural: contiene el diseo de la estructura jerrquica del
doc
o Seccin de comportamiento y funcionamiento: aplicaciones
empleadas para visualizar el documento.
http://www.loc.gov/standards/mets/sfquad.xml

Otros esquemas: Ead


EAD (Encoded Archival Description). El desarrollo de
EAD comenz con un proyecto iniciado en la Biblioteca
de la Universidad de California, Berkeley, en 1993. El
objetivo del proyecto era investigar la posibilidad de
desarrollar un estndar de codificacin, no propietario,
para inventarios, registros, ndices y otros documentos
creados en archivos, bibliotecas, museos y depsitos de
manuscritos para soportar el uso de sus fondos. Utiliza la
sintaxis XML. Versin 2002.
http://www.loc.gov/ead/

Otros esquemas: TEI header


La Text Encoding Initiative es uno de los desarrollos ms
antiguos de SGML, se desarroll en 1987, un ao despus
del lenguaje SGML, y la cabecera contiene informacin
bibliogrfica sobre el documento adjunto. Es un estndar
internacional e interdisciplinar que facilita a las
bibliotecas, museos, editores e investigadores para
representar una variedad de textos literarios y lingsticos
la investigacin y la enseanza en lnea, as como para la
preservacin. http://www.tei-c.org/P4X/HD.html

Otros esquemas: LOM, ONIX...


Learning Object Metadata (LOM) fue aprobado en 2002
por la IEEE-Standards Association.
Onix, desarrollado y mantenido por EDItEUR junto a
Book Industry Communication (UK), el Book Industry
Study Group (US) y otros grupos de editores en Australia,
Canad, Francia, Alemania y la Repblica de Corea.
Content Standard for Digital Geospatial Metadata
(CSDGM) proporciona un conjunto de definiciones y
terminologa comn para la documentacin de los datos
digitales geoespaciales.
...

Dublin Core Metadata Initiative


DCMI representa el esfuerzo multidisciplinar de
bibliotecarios, informticos, profesionales de
archivos, museos y de otros campos acadmicos
relacionados, para adoptar una semntica comn y
crear un estndar sencillo y extensible que pueda
describir una amplia variedad de objetos de
informacin de distintas disciplinas.
Norma ISO 15836-2003

Dublin Core.1
En sus orgenes, Dublin Core sirvi para conectar
o relacionar a los bibliotecarios con las
comunidades Web y dinamizar a la comunidad
bibliotecaria, introduciendo nuevos conceptos y
nueva terminologa, que ha sido fundamental para
el desarrollo y los retos a los que se enfrenta
nuestra profesin en la actualidad.

Dublin Core.2
El esquema de metadatos Dublin Core se gest bajo el
patrocinio de la OCLC (Online Computer Library Center)
y el NCSA (National Center for Supercomputing
Applications). Tambin cont con la participacin de la
IETF (Internet Engineering Task Force), que es una de las
entidades administrativas de Internet (6). El primer
Seminario se celebr en Dublin (Ohio, EEUU) de dnde
Dublin Core tom su nombre. Desde 1995 se han
celebrado 13 Seminarios, el ltimo en Madrid, en
septiembre de 2005.

Principios de Dublin Core


La simplicidad de creacin y mantenimiento.
Todos los elementos son opcionales, repetibles y
pueden disponerse en cualquier orden.
Su extensibilidad.
El alcance internacional de la iniciativa

Los 15 elementos Dublin Core (1996)

Creator (autor)
Title (Ttulo)
Subject (Materia)
Contributor (Colaborador)
Date (Fecha)
Description (Descripcin)
Publisher (Editor)
Type (Tipo de recurso)

Format (Formato)
Coverage (Cobertura)
Rights (Derechos de
Propiedad Intellectual)
Relation (Relacin)
Source (Fuente)
Language (Idioma)
Identifier (Identificador)

DC sin calificar y calificado


El estndar Dublin Core contiene dos niveles:
o Dublin Core sin calificar:
o Contiene los 15 elementos originales.

o Dublin Core calificado:


o Adems de los 15 elementos originales, incluye 3 elementos
adicionales: Audience, Provenance y Rights Holder), as como
un grupo de elementos de refinamiento.

Los calificadores Dublin Core


En julio de 2000, DCMI public una lista con los
calificadores recomendados para los 15 elementos DC
originales. Estos calificadores pueden clasificarse en dos
grupos:
o Los calificadores que refinan o mejoran el valor de un elemento y
hacen que un elemento tenga un significado ms amplio o ms
especfico. Por ejemplo, en el elemento Description pueden
utilizarse los calificadores Table of Contents (para indicar si se
trata de un sumario) o Abstract (para indicar que es un resumen).
o Los sistemas de codificacin de valores que sirven para interpretar
el valor de un elemento. Por ejemplo, los Encabezamientos de
materia de la Library of Congress o una fecha formateada de
manera estndar: "05/02" significa 2 de mayo, y no 5 de febrero)

Distribucin de registros DC
A mediados de la dcada de los 90 se incluan los
metadatos DC en etiquetas META en las pginas Web. La
asignacin de metadatos la hacan los autores de las
pginas Web. Era sencillo, pero poco flexible, poco fiable
(se utilizaba como spamming con fines de promocin) y
dificil de mantener.
A partir de 2000 se utiliza la sintaxis XML/RDF
En 2001, Open Archives Initiative (OAI), y el protocolo
OAI-PMH, promueve la adopcin de Dublin Core sin
calificar para la descripcin de los archivos e-prints y
sintaxis XML.

Resource Description Framework (RDF)


Es una norma que permite crear modelos de metadatos.
Consiste en aplicar la sintaxis XML a los metadatos, y no slo a los
documentos primarios (los textos)
Ventajas:
o. Permite la cohabitacin entre cualquier esquema de metadatos, y
por tanto, una amplia interoperatividad.
o Reduce las disparidades terminolgicas o semnticas que se
presentan, pues al emplear el elemento namespace de XML, aclara
el significado de un campo de cualquier esquema de metadatos
utilizado al describir un recurso de informacin.

Dublin Core/XML-RDF
<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.0/"
xmlns:dcq="http://purl.org/dc/qualifiers/1.0/">
<rdf:Description>
<dc:type>Text Data</dc:type>
<dc:language>spa</dc:language>
<dc:creator>Castells, Manuel, 1942-</dc:creator>
<dc:title>La galaxia Internet / Manuel Castells</dc:title>
<dc:publisher>Barcelona :</dc:publisher>
<dc:publisher>Plaza y Jans, </dc:publisher>
<dc:date>2001</dc:date>
<dc:description>Incluye ndices</dc:description>
<dc:subject>Internet -- Aspectos sociales</dc:subject>
<dc:subject>Globalizacin</dc:subject>
</rdf:Description>
</rdf:RDF>++

DC - Modelos utilizados
Bases de datos
Metadatos DC para extraer automticamente a
travs de la recoleccin (harvesting). OAI-PMH
Metadatos incluidos en pginas Web

Portales temticos. 1
Financiados por organismos pblicos relacionados con la
enseanza superior para servir de apoyo a la enseanza y
la investigacin.
Estos portales se caracterizan porque suelen estar
especializados en un rea temtica concreta y por la
calidad de sus colecciones, ya que la evaluacin, la
seleccin y el tratamiento de los recursos corre a cargo de
bibliotecarios y especialistas en la materia.
Utilizacin de metadatos Dublin Core para la descripcin
de los recursos web.
Utilizacin de sistemas de clasificacin y tesauros

Portales temticos. 2
En el Reino Unido: Resource Descovery Network (RDN)
http://www.rdn.ac.uk. Ofrece en una misma interfaz
muchos de los portales acadmicos britnicos (SOSIG,
OMNI, etc.), donde se pueden hacer consultas simultneas
en todas las bases de datos de recursos web.
El proyecto europeo DESIRE (1996-2000). Potenci el
desarrollo de portales temticos basados en la seleccin,
descripcin y clasificacin de recursos web de calidad.
(DESIRE Information Gateways Handbook)
Proyecto europeo Renardus (continuacin del proyecto
DESIRE) http://www.renardus.org.

CompluRed. Recursos web de la BUC

Plantilla de evaluacin de recursos web


Mdulo de catalogacin. Dublin Core calificado
Mdulo de administracin
Informes y estadstica de uso
Revisin de hipervnculos
Guas temticas

Plantilla de evaluacin de CompluRed


Parmetros:
o
o
o
o
o
o

Autora y edicin
Contenido
Fiabilidad
Accesibilidad
Actualizacin del contenido
Diseo y formato

Mdulo de catalogacin de CompluRed


Mdulo de catalogacin con los metadatos
referidos:
o
o
o
o

al contenido
a la propiedad intelectual
al acceso
a los metadatos administrativos

Interfaz de acceso de CompluRed


rea de consulta:
o Bsqueda por palabra clave
o Lmites por tipo de recurso, lengua y slo texto
completo

rea de navegacin:
o Materias

rea de listados:
o Novedades
o Los recursos ms visitados

Movimiento Open Access. 1


Crisis de precios de las revistas cientficas.
Open Archives Initiative. http://www.openarchives.org/
Budapest Open Access Initiative. En diciembre de 2001, el
Open Society Institute (OSI) celebr una reunin en
Budapest en la que se propuso apoyar el movimiento de
acceso abierto a las publicaciones cientficas. La iniciativa
ha sido firmada por los participantes de Budapest y un
nmero creciente de personas y organizaciones de todo el
mundo que representan a universidades, laboratorios,
bibliotecas, fundaciones, revistas, editores, sociedades
cientficas y otras iniciativas de acceso abierto.
http://www.soros.org/openaccess

Movimiento Open Access. 2


Segn la definicin de BOAI, el acceso abierto a la
literatura cientfica significa que los usuarios pueden leer,
descargar, copiar, distribuir, imprimir, buscar, o enlazar los
textos completos de los artculos cientficos, y, usarlos con
cualquier otro propsito legtimo, sin otras barreras
financieras, legales o tcnicas ms que las que suponga
Internet en s misma. Es decir, sin coste alguno. La nica
restriccin para su reproduccin y distribucin, y el nico
papel del copyright en este mbito del Open Access,
debera ser el otorgar a los autores el control sobre la
integridad de su trabajo y el derecho a ser adecuadamente
reconocidos y citados.

Movimiento Open Access. 3


Declaracin de Berlin sobre el acceso abierto al conocimiento en
Ciencias y Humanidades. Conferencia celebrada en Berlin del 20 al 22
de octubre de 2003. http://www.zim.mpg.de/openaccessberlin/berlindeclaration.html. En espaol:
http://www.geotropico.org/Berlin-I-2.pdf
o Las contribuciones de acceso abierto deben satisfacer dos
condiciones:
1. El (los) autor(es) y depositario(s) de la propiedad intelectual de tales

contribuciones deben garantizar a todos los usuarios por igual, el


derecho gratuito, irrevocable y mundial de acceder a un trabajo erudito,
lo mismo que licencia para copiarlo, usarlo, distribuirlo, transmitirlo y
exhibirlo pblicamente, y para hacer y distribuir trabajos derivativos, en
cualquier medio digital para cualquier propsito responsable, todo sujeto
al reconocimiento apropiado de autora (los estndares de la comunidad
continuarn proveyendo los mecanismos para hacer cumplir el
reconocimiento apropiado y uso responsable de las obras publicadas,
como ahora se hace), lo mismo que el derecho de efectuar copias
impresas en pequeo nmero para su uso personal.

Movimiento Open Access. 4


2. Una versin completa del trabajo y todos sus materiales
complementarios, que incluya una copia del permiso del que se habla
arriba, en un conveniente formato electrnico estndar, se deposita (y
as es publicado) en por lo menos un repositorio online, que utilice
estndares tcnicos aceptables (tales como las definiciones del Acceso
Abierto), que sea apoyado y mantenido por una institucin acadmica,
sociedad erudita, agencia gubernamental, o una bien establecida
organizacin que busque implementar el acceso abierto, distribucin
irrestricta, interoperabilidad y capacidad archivstica a largo plazo."

Movimiento Open Access. 5


Scholarly Publishing and Academic Resources Coalition (SPARC)
http://www.arl.org/sparc/home Programa de la Association of
Research Libraries (ARL). Se trata de una alianza entre universidades,
bibliotecas de investigacin y otras organizaciones que surge como
una respuesta constructiva a los fallos de mercado en el sistema de
comunicacin interuniversitario. SPARC facilita la asociacin de las
partes interesadas en la publicacin para producir alternativas a los
altos precios de las revistas. Su xito ms notable es la publicacin de
Organic Letters en colaboracin con la American Chemical Society
que compite con la revista Tetrahedron Letters de la editorial Elsevier.
SPARC Europe. http://www.sparceurope.org/

Movimiento Open Access. 6

Create Change: un recurso para la accin de profesores y


bibliotecarios por la reforma de la comunicacin acadmica.
http://www.createchange.org/home.html
Proyecto europeo OAForum (Open Archives Forum). Tiene como
objetivo la difusin de la actividad europea relacionada con los
archivos abiertos y la Open Archives Initiative.
http://www.oaforum.org/
SciELO (Scientific Electronic Library Online) Modelo cooperativo
para la publicacin electrnica en pases en desarrollo (Amrica Latina
y Caribe) http://www.scielo.org.
o SciELO Espaa (Ciencias de la Salud).
http://scielo.isciii.es/scielo.php/script_sci_home/lng_es/nrm_iso
DOAJ (Directory of Open Access Journals) http://www.doaj.org.
Proyecto internacional y multidisciplinar desarrollado por la
Universidad de Lund.

Movimiento Open Access. 6


BioMed Central (http://www.biomedcentral.com) publica
ms de cien revistas de acceso abierto, evaluadas por
expertos, en todo el espectro de la biomedicina. Los costes
del procesamiento se cargan a los autores (525 $ por cada
uno).
Public Library of Science (PLoS)
http://www.publiclibraryofscience.org/ Organizacin sin
nimo de lucro creada en 2001 por un grupo de cientficos
comprometidos en convertir la literatura cientfica y
biomdica en un recurso abierto y pblico con el objeto de
facilitar la investigacin y la educacin.

Open Archives Initiative (OAI)


OAI es una iniciativa que desarrolla y promociona
estndares para lograr la interoperatividad entre los
sistemas con el fin de facilitar la eficiente difusin de los
contenidos.
La organizacin est formada por un comit ejecutivo de
gestin y un comit tcnico para la direccin poltica y la
evaluacin de los desarrollos del protocolo.
Los patrocinadores de OAI son la Digital Library
Federation (DLF), la Coalition for Networked Information
(CNI) y la National Science Foundation (NSF).

Conceptos clave en OAI. 1


Archive. El trmino archive del nombre OAI refleja los
orgenes de la iniciativa en la comunidad de e-prints,
dnde el trmino es generalmente aceptado como un
sinnimo para los repositorios de documentos acadmicos
publicados antes de ser enviados a las revistas cientficas
donde son evaluados.
OAI-PMH (Protocol for Metadata Harvesting). Protocolo
para recolectar metadatos.
Protocolo. Conjunto de normas que definen la
comunicacin entre los sistemas. Ej. FTP, HTTP.

Conceptos clave en OAI. 2


Harvesting (recolectar). En el contexto OAI significa
recoger los metadatos procedentes de distintos repositorios
OAI y almacenarlos en una base de datos.
Proveedor de datos (Data provider). Mantiene uno o ms
repositorios que soportan el protocolo OAI-PMH como
medio de exponer sus metadatos.
Proveedor de servicios (Service provider). Recoge los
metadatos de los proveedores de datos y utiliza esos
metadatos como base para construir servicios aadidos.

Orgenes de OAI-PMH
Archivos e-prints:
o arXiv, por Paul Ginsparg, en Los lamos, California,
de Fsica. (1991)
o CogPrints, de Psicologa, Lingstica y neurociencia.
o RePEc, en el campo de la Economa.

Desarrollo del protocolo OAI


Reunin de Santa Fe en octubre de 1999
Ginsparg y Van de Sompel propusieron la creacin de un
servicio universal para que los investigadores pudieran
autoarchivar sus trabajos: Universal Preprint Service o
UPS. La arquitectura UPS identific dos roles:
proveedores de datos y proveedores de servicios.
Dos lneas de trabajo:
o Cross-searching (Z39.50). Problemas por las diferencias en la
sintaxis del lenguaje de bsqueda de cada repositorio. RDN
o Harvest. La solucin era tener todos los registros de metadatos en
un nico sitio.

Convencin de Santa Fe
Acuerdos:
o Protocolo de transporte: HTTP (get y post) y respuestas
XML.
o Esquema de metadatos: Dublin Core sin calificar.
o Una base para asegurar la calidad de los metadatos.
o Propiedad intelectual y derechos de uso.

Versiones de OAI-PMH
v1.0 Enero 2001
v1.1 Julio 2001
v2.0 Junio 2002

Modelo bsico OAI-PMH


Proveedor
de datos
Registro 1
Registro 2
Registro 3
Registro 4

El usuario se conecta
a Google, OAIster o
el archivo.

Otro Proveedor
de datos
Proveedor
servicios

OAI-PMH
Las peticiones y respuestas se envan a travs del
protocolo HTTP.
Las peticiones se codifican como operaciones
GET y POST.
La sintaxis de las respuestas son documentos que
utilizan la sintaxis XML.

Datestamp y Harvesting

Cada registro necesita un datestamp que indica


su fecha de creacin y modificacin.
Estas fechas son utilizadas para permitir la
recoleccin (harvesting) por un rango de fechas y
transferir los metadatos desde un proveedor de
datos a un proveedor de servicios.
Ejemplos:
http://www.ucm.es/eprints/perl/oai2?verb=ListIdentifiers

OAI-PMH
Peticiones
o
o
o
o
o
o

Identify
ListMetadataFormats
ListSets
GetRecord
ListIdentifiers
ListRecords

ListSets. Subconjuntos
Mecanismo del protocolo que permite recolectar
colecciones. No es obligatorio.
Ejemplos:
o Tipos de documentos (Tesis...)
o Perodos de tiempo
o Materias

Archivo E-prints Complutense

Los metadatos en las


bibliotecas universitarias
Universidad de Burgos
28-29 de octubre de 2005

Manuela Palafox Parejo


Servicio de Tecnologas de la Informacin y Sistemas Bibliotecarios
Biblioteca de la Universidad Complutense de Madrid

ndice

Metadatos. Concepto, desarrollo y tendencias


Esquemas de metadatos
Portales temticos
El movimiento Open Access
Open Access Initiative (OAI-PMH)
Los archivos institucionales OAI

Empezamos con la bibliografa bsica


Coplan, Priscilla. Metadata Fundamentals for all
librarians. American Library Association, 2003
Mndez Rodrguez, Eva Mara. Metadatos y recuperacin
de informacin : estndares, problemas y aplicabilidad en
bibliotecas digitales. Trea, 2002
Dublin Core Metadata Initiative (DCMI).
http://dublincore.org
Open Archives Initiative (OAI).
http://www.openarchives.org/
Library of Congress. Standars.
http://www.loc.gov/standards/

La situacin durante la dcada de los 90


Proliferacin de distintos esquemas de metadatos.
En los buscadores encontrbamos muchas
referencias y muy poca precisin en las
bsquedas.
Haba una gran volatilidad de los recursos de
Internet: recursos que desaparecan o cambiaban
de direccin.
Haba un crecimiento exponencial de tipos de
recursos disponibles.

Los metadatos
El concepto de metadatos es anterior a Internet y a
la Web. El trmino fue acuado en el mbito de la
Informtica durante la dcada de los 60. Hoy, se
ha incrementado su inters con el desarrollo de la
publicacin electrnica y las bibliotecas digitales.
Los metadatos se introdujeron en el vocabulario
de la Biblioteconoma en 1995, en el 1 Seminario
de Dublin Core (celebrado en Dublin, Ohio,
EEUU).

El concepto de metadatos
No existe un consenso conceptual sobre el trmino
de metadatos, es diferente segn el colectivo que
los utiliza:
o Informticos: entienden los metadatos a nivel fsico
(nombres de ficheros, formatos, tipos de datos...)
o Gestores de bases de datos: entienden los metadatos
nombres de los objetos de una base de datos, atributos,
relaciones, etc.
o Bibliotecarios: consideran que los metadatos son datos
sobre el contenido, la estructura, la representacin y el
contexto de un conjunto de datos concreto.

El trmino metadatos
Hay dos tendencias en el uso de los metadatos
dentro de la comunidad de bibliotecarios:
o Los llamados generalistas que usan el trmino
metadatos para referirse a la descripcin de recursos
digitales y no digitales.
o Mientras los restrictivos que limitan su uso al mbito
de los recursos electrnicos distribuidos por la Web.

Definiciones de metadatos
La definicin de metadatos ms extendida es datos sobre
otros datos. Etimolgicamente, el trmino metadato/s
procede del prefijo griego meta, que significa algo que
transciende, que va ms all.
Eva Mndez y Jos A. Senso definen los metadatos,
incidiendo en su funcionalidad, como toda aquella
informacin descriptiva sobre el contexto, calidad,
condicin o caractersticas de un recurso, dato u objeto
que tienen la finalidad de facilitar su recuperacin,
autentificacin, evaluacin, preservacin y/o
interoperatividad.

Ms definiciones de metadatos
Los metadatos se definen como informacin estructurada
sobre un recurso de informacin de cualquier tipo o
formato (P. Caplan).
Segn Ukoln, los metadatos son datos estructurados sobre
recursos digitales (y no digitales) que pueden ser utilizados
como ayuda en un amplio rango de operaciones. Por
ejemplo, en la descripcin y localizacin de recursos, en la
gestin de los recursos de informacin, incluida la gestin
de derechos de propiedad intelectual y en su preservacin a
largo plazo. (http://www.ukoln.ac.uk/metadata)

Ejemplos de metadatos
Los registros del catlogo de la biblioteca.
El resumen de un documento.
Las palabras clave extradas de un texto

Para qu sirven los metadatos?


-

Para localizar recursos


Para describir recursos
Para controlar el acceso a los recursos
Para identificar versiones
Para preservar la informacin

Aplicacin de los metadatos.1


Para el sistema, los metadatos:
o Facilitan la interoperatividad entre las herramientas de
bsqueda.
o Permiten gestionar los recursos, definiendo relaciones y
estructuras de los componentes, as como los modos de
acceso. De ah su empleo en dominios distintos: gestin
de bibliotecas digitales, comercio electrnico,
preservacin...

Aplicacin de los metadatos. 2


Para el usuario cumple dos funciones:
o Posibilitar el acceso a la informacin, con los
metadatos puede localizar o descubrir un determinado
recurso (los metadatos asociados a una imagen).
o Evaluar la utilidad o relevancia de un recurso. Con los
metadatos asociados a un recurso puede conocer la
responsabilidad intelectual, el tipo de documento,
derechos de propiedad, condiciones de acceso, etc.

Tipos de metadatos. 1
Segn el dominio de aplicacin:
o Recursos web de portales temticos: Dublin Core
o Registros catalogrficos en catlogos de bibliotecas:
MARC
o Objetos de museos: CIMI (Consortium for the
Interchange Museum Information)
o Recursos geogrficos y geoespaciales (CSDGM)
o Recursos de administraciones pblicas (GILS)
o Recursos de archivos (EAD) .....

Tipos de metadatos. 2
Segn el ciclo de vida de los recursos:
o Metadatos descriptivos
o Metadatos administrativos
o De gestin de derechos
o De preservacin
o De tipo tcnico

Metadatos descriptivos
Los metadatos descriptivos tienen como objetivo
la localizacin (como se encuentra un recurso), la
identificacin (cmo se distingue un recurso de
otro) y la seleccin (cmo determinar que un
recurso cumple una necesidad particular).
Otras funciones de los metadatos descriptivos
incluyen la evaluacin, relaciones y usabilidad.

Metadatos administrativos
Loas metadatos administrativos contienen informacin
para facilitar la gestin de los recursos: cuando fue creado
un recurso, quin es el responsable de controlar el acceso o
archivar el contenido, cules son las restricciones sobre el
acceso, distintas versiones, uso de los recursos, relativos al
nivel de utilizacin.
La categora de metadatos administrativos puede
subdividirse en metadatos de gestin de derechos,
metadatos de preservacin (actualizacin de los datos,
migracin de los contenidos...) y metadatos de tipo tcnico
(informan sobre el funcionamiento del sistema, de los
requisitos de hardware y software...)

Tipos de metadatos. 3
Segn la complejidad estructural:
o Metadatos desestructurados: los metadatos generados
automticamente por los robots a partir del texto en
HTML y de algunas etiquetas como <title>, <meta>...
o Metadatos semiestructurados: para estructuras
semnticas sencillas, como Dublin Core
o Metadatos estructurados: MARC

Esquemas de metadatos. 1

Un esquema de metadatos es un conjunto de campos, junto con sus


reglas de uso y una sintaxis, concebido para un propsito concreto.
Existe una amplia variedad de esquemas de metadatos, dependiendo
de los objetivos y caractersticas de los distintos proyectos :
o Metadatos de propsito general, dirigidos a describir cualquier
tipo de informacin digital. Por ejemplo, el esquema Dublin Core
o METS (Metadata Encoding and Transmission Standard).
o Metadatos de propsito especfico, vinculados a un campo
temtico en particular como el esquema EAD (Encoded Archival
Description) que se emplea para describir informacin de archivo
o el modelo TEI-Header (Text Encoding Iniciative) para describir
informacin textual en el rea de las Humanidades, etc.

Esquemas de metadatos. 2

Caractersticas de un esquema de metadatos:


o Semntica: alude al significado de los campos, su carcter
obligatorio, si puede ser repetible
o Reglas de contenido: prescriben cmo seleccionar y representar
los valores de un campo.
o Sintaxis: fija la codificacin de los campos del esquema en la
mquina, para ofrecer un formato de intercambio.
Ejemplo:
o El esquema MARC es un compuesto de diferentes normas:
ISO2709, MARC21, Anglo-American Cataloguing Rules, ISBD.
o Clases de elementos MARC: campos, indicadores y subcampos
o ISO 2709 no asigna significados a estos elementos, quien lo hace
es MARC21

Metadatos y lenguajes de marcado


Clases de marcado:
o Marcas de procesamiento: orientadas a la presentacin
de la informacin (HTML)
o Marcas descriptivas: identifican los elementos
estructurales de un texto, determinando su estructura
lgica o infraestructura del contenido documental
(XML)

Lenguaje de marcas XML

Hereda la misma estructura que SGML (elementos, atributos).


Se puede emplear mediante dos herramientas: DTDs o Esquemas (que
tienen sintaxis xml).
Gestiona espacios de nombre (namespaces).
Puede visualizarse en navegadores empleando XLS.
Ventajas:
o Gestiona informacin jerrquica (ej: todos los documentos de una pgina
web en un mismo registro estructurado).
o Integra informacin textual y multimedia (ej: un documento con texto,
sonido e imagen)
o Permite el intercambio entre esquemas (crosswalks)
o Los datos estn en formato ascii, lo que facilita el intercambio de
informacin entre aplicaciones.

Evolucin de los metadatos: de las sintaxis


cerradas a las sintaxis abiertas
Sintaxis ISO 2709 para MARC21

Metadatos - ISO 2709 (estructura)


Cabecera (24)
Directorio (variable)
-Etiqueta:1- 3
-Long Campo:4-7
-Comienzo:8-12

Campos de datos

Metadatos- Dublin Core/Metaetiquetas HTML.1


- La sintaxis DC en HTML utiliza las etiquetas
<META>
- <META name=valor content=valor>
- Name especifica la propiedad y Content el valor
de la propiedad. Carecen de valores fijados, por lo
que se utilizan como spamming con fines de
promocin.

Metadatos- Dublin Core/Metaetiquetas HTML. 2


- Ejemplo:
<META name: DC.type content=text data>
<META name: DC. language content=spa>
<META name: DC. creator content=Castell, Manuel>
<META name: DC. date content=2001>
<META name: DC. title content=La galaxia Internet >
<META name: DC. creator content=Manuel Castells>
<META name: DC. publisher content=Barcelona>
<META name: DC. publisher content=Plaza y Jans>
<META name: DC. subject content=Internet -- Aspectos sociales>

Metadatos- Dublin Core/XML-RDF


<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.0/"
xmlns:dcq="http://purl.org/dc/qualifiers/1.0/">
<rdf:Description>
<dc:type>Text Data</dc:type>
<dc:language>spa</dc:language>
<dc:creator>Castells, Manuel, 1942-</dc:creator>
<dc:title>La galaxia Internet / Manuel Castells</dc:title>
<dc:publisher>Barcelona :</dc:publisher>
<dc:publisher>Plaza y Jans, </dc:publisher>
<dc:date>2001</dc:date>
<dc:description>Incluye ndices</dc:description>
<dc:subject>Internet -- Aspectos sociales</dc:subject>
<dc:subject>Globalizacin</dc:subject>
</rdf:Description>
</rdf:RDF>++

Metadatos MODS

MODS (Metadata Object and Description Schema) es un esquema de


metadatos descriptivo compatible con MARC y con sintaxis XML.
Propsito: superar las insuficiencias de MARC. El esquema MODS
traslada a XML los metadatos MARC.
Hereda la semntica de MARC.
Los campos numricos de MARC han sido sustituidos por campos de
texto.
Conversin o mapping entre MARC-MODS.
http://www.loc.gov/standards/mods/mods-mapping.html)

Metadatos METS

METS significa Metadata Encoding and Transmisin Standard


Es una norma convergente e integradora, destinada a describir,
transmitir y gestionar recursos digitales.
Surge en el seno de la Digital Library Federation( DLF) como
respuesta al modelo gestin de depsitos de recursos digitales OAIS.
Permite un gestin integral y jerrquica de manifestaciones de una
misma obra: texto, grabacin sonora y vdeo de una conferencia.
Esquema XML que empaqueta todos los metadatos asociados con un
recurso digital (descriptivos, administrativos, estructurales necesarios
para recuperar, preservar y ofrecer recursos digitales).

Metadatos METS

Partes de un registro METS:


o Cabecera: informa del doc METS mismo (identificadores, fecha de
creacin, actualizaciones y status)
o Metadatos descriptivos: admite esquemas DC, MARCXML y
MODS
o Metadatos administrativos para difusin y preservacin
o Seccin de ficheros: identifica la totalidad de ficheros que
componen el objeto
o Mapa estructural: contiene el diseo de la estructura jerrquica del
doc
o Seccin de comportamiento y funcionamiento: aplicaciones
empleadas para visualizar el documento.
http://www.loc.gov/standards/mets/sfquad.xml

Otros esquemas: Ead


EAD (Encoded Archival Description). El desarrollo de
EAD comenz con un proyecto iniciado en la Biblioteca
de la Universidad de California, Berkeley, en 1993. El
objetivo del proyecto era investigar la posibilidad de
desarrollar un estndar de codificacin, no propietario,
para inventarios, registros, ndices y otros documentos
creados en archivos, bibliotecas, museos y depsitos de
manuscritos para soportar el uso de sus fondos. Utiliza la
sintaxis XML. Versin 2002.
http://www.loc.gov/ead/

Otros esquemas: TEI header


La Text Encoding Initiative es uno de los desarrollos ms
antiguos de SGML, se desarroll en 1987, un ao despus
del lenguaje SGML, y la cabecera contiene informacin
bibliogrfica sobre el documento adjunto. Es un estndar
internacional e interdisciplinar que facilita a las
bibliotecas, museos, editores e investigadores para
representar una variedad de textos literarios y lingsticos
la investigacin y la enseanza en lnea, as como para la
preservacin. http://www.tei-c.org/P4X/HD.html

Otros esquemas: LOM, ONIX...


Learning Object Metadata (LOM) fue aprobado en 2002
por la IEEE-Standards Association.
Onix, desarrollado y mantenido por EDItEUR junto a
Book Industry Communication (UK), el Book Industry
Study Group (US) y otros grupos de editores en Australia,
Canad, Francia, Alemania y la Repblica de Corea.
Content Standard for Digital Geospatial Metadata
(CSDGM) proporciona un conjunto de definiciones y
terminologa comn para la documentacin de los datos
digitales geoespaciales.
...

Dublin Core Metadata Initiative


DCMI representa el esfuerzo multidisciplinar de
bibliotecarios, informticos, profesionales de
archivos, museos y de otros campos acadmicos
relacionados, para adoptar una semntica comn y
crear un estndar sencillo y extensible que pueda
describir una amplia variedad de objetos de
informacin de distintas disciplinas.
Norma ISO 15836-2003

Dublin Core.1
En sus orgenes, Dublin Core sirvi para conectar
o relacionar a los bibliotecarios con las
comunidades Web y dinamizar a la comunidad
bibliotecaria, introduciendo nuevos conceptos y
nueva terminologa, que ha sido fundamental para
el desarrollo y los retos a los que se enfrenta
nuestra profesin en la actualidad.

Dublin Core.2
El esquema de metadatos Dublin Core se gest bajo el
patrocinio de la OCLC (Online Computer Library Center)
y el NCSA (National Center for Supercomputing
Applications). Tambin cont con la participacin de la
IETF (Internet Engineering Task Force), que es una de las
entidades administrativas de Internet (6). El primer
Seminario se celebr en Dublin (Ohio, EEUU) de dnde
Dublin Core tom su nombre. Desde 1995 se han
celebrado 13 Seminarios, el ltimo en Madrid, en
septiembre de 2005.

Principios de Dublin Core


La simplicidad de creacin y mantenimiento.
Todos los elementos son opcionales, repetibles y
pueden disponerse en cualquier orden.
Su extensibilidad.
El alcance internacional de la iniciativa

Los 15 elementos Dublin Core (1996)

Creator (autor)
Title (Ttulo)
Subject (Materia)
Contributor (Colaborador)
Date (Fecha)
Description (Descripcin)
Publisher (Editor)
Type (Tipo de recurso)

Format (Formato)
Coverage (Cobertura)
Rights (Derechos de
Propiedad Intellectual)
Relation (Relacin)
Source (Fuente)
Language (Idioma)
Identifier (Identificador)

DC sin calificar y calificado


El estndar Dublin Core contiene dos niveles:
o Dublin Core sin calificar:
o Contiene los 15 elementos originales.

o Dublin Core calificado:


o Adems de los 15 elementos originales, incluye 3 elementos
adicionales: Audience, Provenance y Rights Holder), as como
un grupo de elementos de refinamiento.

Los calificadores Dublin Core


En julio de 2000, DCMI public una lista con los
calificadores recomendados para los 15 elementos DC
originales. Estos calificadores pueden clasificarse en dos
grupos:
o Los calificadores que refinan o mejoran el valor de un elemento y
hacen que un elemento tenga un significado ms amplio o ms
especfico. Por ejemplo, en el elemento Description pueden
utilizarse los calificadores Table of Contents (para indicar si se
trata de un sumario) o Abstract (para indicar que es un resumen).
o Los sistemas de codificacin de valores que sirven para interpretar
el valor de un elemento. Por ejemplo, los Encabezamientos de
materia de la Library of Congress o una fecha formateada de
manera estndar: "05/02" significa 2 de mayo, y no 5 de febrero)

Distribucin de registros DC
A mediados de la dcada de los 90 se incluan los
metadatos DC en etiquetas META en las pginas Web. La
asignacin de metadatos la hacan los autores de las
pginas Web. Era sencillo, pero poco flexible, poco fiable
(se utilizaba como spamming con fines de promocin) y
dificil de mantener.
A partir de 2000 se utiliza la sintaxis XML/RDF
En 2001, Open Archives Initiative (OAI), y el protocolo
OAI-PMH, promueve la adopcin de Dublin Core sin
calificar para la descripcin de los archivos e-prints y
sintaxis XML.

Resource Description Framework (RDF)


Es una norma que permite crear modelos de metadatos.
Consiste en aplicar la sintaxis XML a los metadatos, y no slo a los
documentos primarios (los textos)
Ventajas:
o. Permite la cohabitacin entre cualquier esquema de metadatos, y
por tanto, una amplia interoperatividad.
o Reduce las disparidades terminolgicas o semnticas que se
presentan, pues al emplear el elemento namespace de XML, aclara
el significado de un campo de cualquier esquema de metadatos
utilizado al describir un recurso de informacin.

Dublin Core/XML-RDF
<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.0/"
xmlns:dcq="http://purl.org/dc/qualifiers/1.0/">
<rdf:Description>
<dc:type>Text Data</dc:type>
<dc:language>spa</dc:language>
<dc:creator>Castells, Manuel, 1942-</dc:creator>
<dc:title>La galaxia Internet / Manuel Castells</dc:title>
<dc:publisher>Barcelona :</dc:publisher>
<dc:publisher>Plaza y Jans, </dc:publisher>
<dc:date>2001</dc:date>
<dc:description>Incluye ndices</dc:description>
<dc:subject>Internet -- Aspectos sociales</dc:subject>
<dc:subject>Globalizacin</dc:subject>
</rdf:Description>
</rdf:RDF>++

DC - Modelos utilizados
Bases de datos
Metadatos DC para extraer automticamente a
travs de la recoleccin (harvesting). OAI-PMH
Metadatos incluidos en pginas Web

Portales temticos. 1
Financiados por organismos pblicos relacionados con la
enseanza superior para servir de apoyo a la enseanza y
la investigacin.
Estos portales se caracterizan porque suelen estar
especializados en un rea temtica concreta y por la
calidad de sus colecciones, ya que la evaluacin, la
seleccin y el tratamiento de los recursos corre a cargo de
bibliotecarios y especialistas en la materia.
Utilizacin de metadatos Dublin Core para la descripcin
de los recursos web.
Utilizacin de sistemas de clasificacin y tesauros

Portales temticos. 2
En el Reino Unido: Resource Descovery Network (RDN)
http://www.rdn.ac.uk. Ofrece en una misma interfaz
muchos de los portales acadmicos britnicos (SOSIG,
OMNI, etc.), donde se pueden hacer consultas simultneas
en todas las bases de datos de recursos web.
El proyecto europeo DESIRE (1996-2000). Potenci el
desarrollo de portales temticos basados en la seleccin,
descripcin y clasificacin de recursos web de calidad.
(DESIRE Information Gateways Handbook)
Proyecto europeo Renardus (continuacin del proyecto
DESIRE) http://www.renardus.org.

CompluRed. Recursos web de la BUC

Plantilla de evaluacin de recursos web


Mdulo de catalogacin. Dublin Core calificado
Mdulo de administracin
Informes y estadstica de uso
Revisin de hipervnculos
Guas temticas

Plantilla de evaluacin de CompluRed


Parmetros:
o
o
o
o
o
o

Autora y edicin
Contenido
Fiabilidad
Accesibilidad
Actualizacin del contenido
Diseo y formato

Mdulo de catalogacin de CompluRed


Mdulo de catalogacin con los metadatos
referidos:
o
o
o
o

al contenido
a la propiedad intelectual
al acceso
a los metadatos administrativos

Interfaz de acceso de CompluRed


rea de consulta:
o Bsqueda por palabra clave
o Lmites por tipo de recurso, lengua y slo texto
completo

rea de navegacin:
o Materias

rea de listados:
o Novedades
o Los recursos ms visitados

Movimiento Open Access. 1


Crisis de precios de las revistas cientficas.
Open Archives Initiative. http://www.openarchives.org/
Budapest Open Access Initiative. En diciembre de 2001, el
Open Society Institute (OSI) celebr una reunin en
Budapest en la que se propuso apoyar el movimiento de
acceso abierto a las publicaciones cientficas. La iniciativa
ha sido firmada por los participantes de Budapest y un
nmero creciente de personas y organizaciones de todo el
mundo que representan a universidades, laboratorios,
bibliotecas, fundaciones, revistas, editores, sociedades
cientficas y otras iniciativas de acceso abierto.
http://www.soros.org/openaccess

Movimiento Open Access. 2


Segn la definicin de BOAI, el acceso abierto a la
literatura cientfica significa que los usuarios pueden leer,
descargar, copiar, distribuir, imprimir, buscar, o enlazar los
textos completos de los artculos cientficos, y, usarlos con
cualquier otro propsito legtimo, sin otras barreras
financieras, legales o tcnicas ms que las que suponga
Internet en s misma. Es decir, sin coste alguno. La nica
restriccin para su reproduccin y distribucin, y el nico
papel del copyright en este mbito del Open Access,
debera ser el otorgar a los autores el control sobre la
integridad de su trabajo y el derecho a ser adecuadamente
reconocidos y citados.

Movimiento Open Access. 3

Declaracin de Berlin sobre el acceso abierto al conocimiento en


Ciencias y Humanidades. Conferencia celebrada en Berlin del 20 al 22
de octubre de 2003. http://www.zim.mpg.de/openaccessberlin/berlindeclaration.html. En espaol:
http://www.geotropico.org/Berlin-I-2.pdf
o Las contribuciones de acceso abierto deben satisfacer dos
condiciones:
1. El (los) autor(es) y depositario(s) de la propiedad intelectual de tales

contribuciones deben garantizar a todos los usuarios por igual, el


derecho gratuito, irrevocable y mundial de acceder a un trabajo erudito,
lo mismo que licencia para copiarlo, usarlo, distribuirlo, transmitirlo y
exhibirlo pblicamente, y para hacer y distribuir trabajos derivativos, en
cualquier medio digital para cualquier propsito responsable, todo sujeto
al reconocimiento apropiado de autora (los estndares de la comunidad
continuarn proveyendo los mecanismos para hacer cumplir el
reconocimiento apropiado y uso responsable de las obras publicadas,
como ahora se hace), lo mismo que el derecho de efectuar copias
impresas en pequeo nmero para su uso personal.

Movimiento Open Access. 4


2. Una versin completa del trabajo y todos sus materiales
complementarios, que incluya una copia del permiso del que se habla
arriba, en un conveniente formato electrnico estndar, se deposita (y
as es publicado) en por lo menos un repositorio online, que utilice
estndares tcnicos aceptables (tales como las definiciones del Acceso
Abierto), que sea apoyado y mantenido por una institucin acadmica,
sociedad erudita, agencia gubernamental, o una bien establecida
organizacin que busque implementar el acceso abierto, distribucin
irrestricta, interoperabilidad y capacidad archivstica a largo plazo."

Movimiento Open Access. 5

Scholarly Publishing and Academic Resources Coalition (SPARC)


http://www.arl.org/sparc/home Programa de la Association of
Research Libraries (ARL). Se trata de una alianza entre universidades,
bibliotecas de investigacin y otras organizaciones que surge como
una respuesta constructiva a los fallos de mercado en el sistema de
comunicacin interuniversitario. SPARC facilita la asociacin de las
partes interesadas en la publicacin para producir alternativas a los
altos precios de las revistas. Su xito ms notable es la publicacin de
Organic Letters en colaboracin con la American Chemical Society
que compite con la revista Tetrahedron Letters de la editorial Elsevier.
SPARC Europe. http://www.sparceurope.org/

Movimiento Open Access. 6


Create Change: un recurso para la accin de profesores y
bibliotecarios por la reforma de la comunicacin acadmica.
http://www.createchange.org/home.html
Proyecto europeo OAForum (Open Archives Forum). Tiene como
objetivo la difusin de la actividad europea relacionada con los
archivos abiertos y la Open Archives Initiative.
http://www.oaforum.org/
SciELO (Scientific Electronic Library Online) Modelo cooperativo
para la publicacin electrnica en pases en desarrollo (Amrica Latina
y Caribe) http://www.scielo.org.
o SciELO Espaa (Ciencias de la Salud).
http://scielo.isciii.es/scielo.php/script_sci_home/lng_es/nrm_iso
DOAJ (Directory of Open Access Journals) http://www.doaj.org.
Proyecto internacional y multidisciplinar desarrollado por la
Universidad de Lund.

Movimiento Open Access. 6


BioMed Central (http://www.biomedcentral.com) publica
ms de cien revistas de acceso abierto, evaluadas por
expertos, en todo el espectro de la biomedicina. Los costes
del procesamiento se cargan a los autores (525 $ por cada
uno).
Public Library of Science (PLoS)
http://www.publiclibraryofscience.org/ Organizacin sin
nimo de lucro creada en 2001 por un grupo de cientficos
comprometidos en convertir la literatura cientfica y
biomdica en un recurso abierto y pblico con el objeto de
facilitar la investigacin y la educacin.

Open Archives Initiative (OAI)


OAI es una iniciativa que desarrolla y promociona
estndares para lograr la interoperatividad entre los
sistemas con el fin de facilitar la eficiente difusin de los
contenidos.
La organizacin est formada por un comit ejecutivo de
gestin y un comit tcnico para la direccin poltica y la
evaluacin de los desarrollos del protocolo.
Los patrocinadores de OAI son la Digital Library
Federation (DLF), la Coalition for Networked Information
(CNI) y la National Science Foundation (NSF).

Conceptos clave en OAI. 1


Archive. El trmino archive del nombre OAI refleja los
orgenes de la iniciativa en la comunidad de e-prints,
dnde el trmino es generalmente aceptado como un
sinnimo para los repositorios de documentos acadmicos
publicados antes de ser enviados a las revistas cientficas
donde son evaluados.
OAI-PMH (Protocol for Metadata Harvesting). Protocolo
para recolectar metadatos.
Protocolo. Conjunto de normas que definen la
comunicacin entre los sistemas. Ej. FTP, HTTP.

Conceptos clave en OAI. 2


Harvesting (recolectar). En el contexto OAI significa
recoger los metadatos procedentes de distintos repositorios
OAI y almacenarlos en una base de datos.
Proveedor de datos (Data provider). Mantiene uno o ms
repositorios que soportan el protocolo OAI-PMH como
medio de exponer sus metadatos.
Proveedor de servicios (Service provider). Recoge los
metadatos de los proveedores de datos y utiliza esos
metadatos como base para construir servicios aadidos.

Orgenes de OAI-PMH
Archivos e-prints:
o arXiv, por Paul Ginsparg, en Los lamos, California,
de Fsica. (1991)
o CogPrints, de Psicologa, Lingstica y neurociencia.
o RePEc, en el campo de la Economa.

Desarrollo del protocolo OAI


Reunin de Santa Fe en octubre de 1999
Ginsparg y Van de Sompel propusieron la creacin de un
servicio universal para que los investigadores pudieran
autoarchivar sus trabajos: Universal Preprint Service o
UPS. La arquitectura UPS identific dos roles:
proveedores de datos y proveedores de servicios.
Dos lneas de trabajo:
o Cross-searching (Z39.50). Problemas por las diferencias en la
sintaxis del lenguaje de bsqueda de cada repositorio. RDN
o Harvest. La solucin era tener todos los registros de metadatos en
un nico sitio.

Convencin de Santa Fe
Acuerdos:
o Protocolo de transporte: HTTP (get y post) y respuestas
XML.
o Esquema de metadatos: Dublin Core sin calificar.
o Una base para asegurar la calidad de los metadatos.
o Propiedad intelectual y derechos de uso.

Versiones de OAI-PMH
v1.0 Enero 2001
v1.1 Julio 2001
v2.0 Junio 2002

Modelo bsico OAI-PMH


Proveedor
de datos
Registro 1
Registro 2
Registro 3
Registro 4

El usuario se conecta
a Google, OAIster o
el archivo.

Otro Proveedor
de datos
Proveedor
servicios

OAI-PMH
Las peticiones y respuestas se envan a travs del
protocolo HTTP.
Las peticiones se codifican como operaciones
GET y POST.
La sintaxis de las respuestas son documentos que
utilizan la sintaxis XML.

Datestamp y Harvesting

Cada registro necesita un datestamp que indica


su fecha de creacin y modificacin.
Estas fechas son utilizadas para permitir la
recoleccin (harvesting) por un rango de fechas y
transferir los metadatos desde un proveedor de
datos a un proveedor de servicios.
Ejemplos:
http://www.ucm.es/eprints/perl/oai2?verb=ListIdentifiers&metadataPrefi

OAI-PMH
Peticiones
o
o
o
o
o
o

Identify
ListMetadataFormats
ListSets
GetRecord
ListIdentifiers
ListRecords

ListSets. Subconjuntos
Mecanismo del protocolo que permite recolectar
colecciones. No es obligatorio.
Ejemplos:
o Tipos de documentos (Tesis...)
o Perodos de tiempo
o Materias

Archivo E-prints Complutense

S-ar putea să vă placă și