Sunteți pe pagina 1din 69

Bibliotecas Digitales

Carlos Becerra Castro


Ingeniero Civil Informtico Magster en Ciencias de La ingeniera Informtica.

Introduccin.

La bibliotecas digitales dan soporte a expertos en diferentes disciplinas. Con diferentes backgrounds (conocimientos de dominio) . Diferentes enfoques (automatizacin (ges), bsqueda, navegacin, recomendaciones).

Definicin
Terminologa
Biblioteca Automatizada

Bibliotecas

tradicionales (sede fsica), que emplean equipos y programas informticos para su gestin. Descripcin de sus colecciones y la recuperacin de la informacin.
Descripcin

de los recursos y servicios que ofrecen a sus usuarios presenciales

Definicin
Biblioteca Electrnica
Es

aquella que cuenta con sistemas de automatizacin que le permiten una gil y correcta administracin de los materiales que resguarda, principalmente en papel. principalmente catlogos y listas de las colecciones que se encuentran fsicamente dentro de un edificio.

Proporciona

Definicin
Biblioteca Digital
Es un repositorio de contenidos digitalizados, almacenados en diferentes formatos electrnicos por lo que el original en papel, en caso de existir, pierde supremaca.

Generalmente, son bibliotecas especializadas, con colecciones limitadas a slo algunos temas.

Definicin
Portales Conjunto de documentos web y servicios de informacin a los que se accede desde una nica interfaz.

Pueden ser generales (horizontales) o especializados (verticales).

Suelen contener: informacin, directorio de recursos externos, buscador, servicios de comunicacin, bases de datos, etc.

Definicin.

Un definicin de Biblioteca digital es:


Una

coleccin administrada de informacin, con ciertos servicios asociados, donde la informacin es guardada en formatos digitales y accedida a travs de una red.

Definicin.

Una parte importante es que la informacin es gestionada.


Datos organizados sistemticamente, generan una biblioteca digital.

Definicin.

Las bibliotecas digitales tienen asociadas:


Procedimientos

para seleccionar el material. Procedimientos para organizar el material. Procedimientos para ingresar al material. Procedimientos para guardar el material.

Definicin.

El problema:
La

gente crea informacin que debe ser almacenada, organizada y distribuida. Adems se necesita encontrar informacin que otros han creado (indexacin).

NO SON BIBLIOTECAS DIGITALES...

Cualquier recopilacin de documentos digitalizados. Una lista de enlaces ms o menos organizados. Cualquier base de datos con interfaz web.

OPORTUNIDADES QUE OFRECEN LAS BD (1)

Promueven el acceso a la informacin, de forma econmica y eficiente, a todos los sectores de la sociedad. Son piezas clave para el desarrollo y mejora de la educacin, la investigacin y el desarrollo.
Posibilitan el acceso a colecciones difciles de consultar por otras vas.

OPORTUNIDADES QUE OFRECEN LAS BD (2)

Pueden resultar ms econmicas, porque permiten compartir recursos. Sirven para reforzar la comunicacin y colaboracin. Los proyectos de cooperacin nacional e internacional inciden en el desarrollo de aspectos tecnolgicos, sociolgicos, legislativos, etc.

Terminologa bsica.

Es necesario definir una terminologa base para poder trabajar en este tema, sobre todo por que se trabaja en dominios diferentes.

Colecciones.

Informacin que puede ser codificada en secuencia de bits.


En la mayora de los casos son textos, imgenes, videos, sonidos. Se expande a medios que ya nos son similares a los medios fsicos (bases de datos, juegos, software). Estn asociadas a un dominio especifico.

Data y metadata.

Data est asociada a informacin que es almacenada en formato digital. Metadata es informacin acerca de la Data.
Su estructuracin afecta a la mantencin y preservacin de los objetos digitales.

Metadata.

Normalmente incluye:
Metadata

Descriptiva (referencias bibliografitas). Metadata estructural (informacin de formatos). Metadata Administrativa (Permisos, Accesos).

Metadata

Esto fue organizado en 1960s con las iniciativas:


MARC

(Machine Readable Cataloguing) y AACR (Anglo-American Cataloguing Rules).

El estndar MARC provee una forma de catalogar informacin que pueda ser compartida por distintos sistemas. AACR provee reglas de consistencia que permiten construir estos catlogos.

Metadata

Un importante estndar de metadata descriptiva es Dublin Core.


Tiene 15 tems de informacin fciles de entender y usar. Permite ser adaptado para diferentes comunidades de usuarios (agregando campos si es necesario).

Metadata.

Los elementos son:


Title:

un nombre dado al recurso. Creator: Entidad responsable de desarrollar el contenido del recurso. Subject and Keywords: El tpico del contenido del recurso.

Metadata.

Description: Especificacin del contenido del recurso. Publisher: Entidad responsable de hacer el recurso disponible. Contributor: Entidad que ha hecho contribuciones al recurso.

Metadata.

Date: Asociada a un evento en el ciclo de vida del recurso (creacin, disponibilidad). Resource Type: Naturaleza del contenido del recurso. Format: Estructuracin fsica o digital del recurso.

Metadata.

Resource Identifier: Referencia al recurso.


Source: Referencia de donde el recurso fue derivado u obtenido. Language: Lenguaje del contenido del recurso. Relation: Referencia a recursos relacionados.

Metadata.

Coverage: el mbito del recurso.


Rights Management: Informacin acerrca de los derechos sobre el recurso (derechos de autor).

tems en una biblioteca digital.

Es un material que es almacenado en una biblioteca digital. Tiene data, metadata asociada y un identificador. No es sinnimo de documento.

Presentacin, diseminacin y almacenamiento.

La forma en que se almacenan los objetos es diferente a la forma en que son utilizados.
Almacenamiento Presentacin

(sonido, video, imgenes)

(secuencia de imgenes, sonido

sintetizado).
Diseminacin:

Transformacin de almacenamiento a

presentacin.

Personas.

Se emplea una variedad de palabras para describir a las personas relacionadas con las bibliotecas digitales:
Creadores:

autores, compositores, algien que cree intelectualmente los objetos. Usuarios:


Lectores. Clientes.

Objetivos del desarrollo de BD.

Crear tecnologas de digitalizacin.


Esquemas de matadata. Tcnicas de administracin de data. Tcnicas de preservacin digital (comunidades auto sustentables).

Objetivos del desarrollo de BD.

Dan Greenstein, director de Digital Library Federation y California Digital Library, caracteriza a este desarrollo como:
la

segunda generacin de bibliotecas digitales. Donde se desarrollan nuevas oportunidades y competencias.

Objetivos del desarrollo de BD.

La tercera generacin esta asociada a:

Integracin de material digital en colecciones de libreras con una arquitectura modular. piensa en como generar y ensamblar servicios entregados por diversos proveedores (a nivel da datos y a nivel de dominios).

Se

Objetivos del desarrollo de BD.

Con el acceso a una biblioteca digital un individuo puede:


Acceder

a recursos a travs de catlogos automatizados. Localizar versiones fsicas y digitales de artefactos. Optimizar bsquedas.

Objetivos del desarrollo de BD.


Desarrollar

recomendaciones (basas en perfiles, histricos). bsquedas personalizadas.

Desarrollar
Generar

conocimiento acerca de los artefactos.

Componentes funcionales de una BD.


Un

sistema que define una biblioteca digital debera tener los siguientes componentes.
Conversor de contenido (fsico-digital). Extractor o creador de metadata (intencional v/s no intencional). Repositorio de los artefactos digitales y la metadata.

Componentes funcionales de una BD.


Servidor para el navegador cliente (repository queryng). Servidor de contenido (file transfer, streaming media). Browser para acceder al contenido (generador de consultas). Red.

Componentes funcionales de una BD.

Desarrollo de un portal.

Debe permitir desarrollar una coleccin de objetos y dar acceso a estos.


Unifica cierta cantidad de vistas las cuales dan a los usuarios formas de localizacin acceso a la informacin y los artefactos contenidos en la BD.

Desarrollo de un portal.

Iniciativas de BD.

University of California at Berkeley


http://elib.cs.berkeley.edu

Harvard University
http://lib.harvard.edu

Stanford University
http://www-sul.stanford.edu

University of California at Berkeley.

Inicialmente contena:
Catlogos Links Link

e ndices a contenido electrnico.

a colecciones digitales.

a investigacin y desarrollo de BD. de herramientas para construir BD.

Informacin

University of California at Berkeley.


Actualmente esta asociada al desarrollo de GenDL (Generic Digital Library). Incluye 3 sistemas separados:

Administrador

de contenido Web: creacin y mantencin de contenido digital. Repositorio de contenido. Sistema de Acceso.

University of California at Berkeley.

Harvard University

Sistema de bibliotecas descentralizado incluye mas d e100 bibliotecas y 35 colecciones de investigacin.


Se centro en crear practicas comines de digitalizacin, formateo, creacin de metadata, preservacin y migracin de objetos.

Harvard University

El repositorio Oracle soporta todos los tipos de objetos multimedia y un conjunto de catlogos.
Un portal permite realizar la bsqueda a travs de los catlogos.

Harvard University

Stanford University.

Trabaja con un administrador de objetos multimedias TEAMS.


Utiliza Luna para administrar imgenes de alta resolucin. Trabaja con METS (Metadata Encoding and Transmission Standard) como estndar de metadata.

Stanford University.

Arquitectura de una BD.

Modelo de artefactos objetos digitales Nombre unicos URNs (Uniform Resource Names). Servicios para bibliotecas digitales. Tcnicas de definicin de colecciones. Administracin de contenido y servicios distribuidos. Administracin de propiedad intelectual.

Principios claves.

Open Architecture

Funcionalidad dividida en un conjunto de well-defined services Servicios accesibles mediante well-defined protocol Promover interoperabilidad Sistema escalable (biblioteca de investigacin, Web informal) Exista la posibilidad de agregarla en otras colecciones.

Modularizacin

Federada

Distribucin

De contenidos (colecciones) and servicios De administracin y gestin de la BD

Componente de una BD.


Collection Services Name Service
Persistent NAMES

User Interface Gateway

Index Services

Digital Objects

Repository Services

Personal Multidisciplinario

Para crear, planificar, implementar y administrar una biblioteca digital se requiere de un equipo de profesionales multidisciplinario, donde cada uno de ellos contribuye con sus conocimientos y habilidades.
Bibliotecarios, profesionales de la informacin Informticos Telemticos Diseadores, entre otros

Contenidos
Parte fundamental o escencial de la biblioteca digital son los contenidos electrnicos, o mas conocidos como objetos digitales, estos pueden ser de diversos tipos, formatos, con derechos de autor o libres.

Contenidos
Tipos
- Textos (Libros, revistas, artculos de revistas, peridicos, tesis, ponencias, etc.) - Bases de datos referenciales a texto completo. - Audios, videos, material multimedia. - Pginas Web, Portales, etc. - Cualquier objeto digital, que sea pertinente segn el modelo de la biblioteca digital.

Contenidos
Formatos
TEXTO .DOC .TXT .RTF .PDF IMAGEN .BMP .TIF .GIF .PNG .WMF .PICT .PCD .EPS .EMF .CGM .TGA .JPG ANIMACIN .ANI .FLI .FLC AUDIO .WAV .MID .SND .AUD VIDEO .AVI .MOV .MPG .QT PAGINAS WEB .HTM .HTML .DHTML .HTMLS .XML

Contenidos
Con derechos de autor
- Subscripcin a bases de datos referenciales y de texto completo o mixtas. - Subscripcin a revistas individuales o conjuntos de ellas - Servicios de recuperacin de documentos Libros electrnicos - Subscripcin a portales con servicios de informacin de diversos tipos

Contenidos

Libres de derechos de autor


- Los de acceso pblico existentes en la red, de diversos tipos y formatos

-Los generados por la propia institucin y que son dispuestos, autorizados para su acceso libre.
- Iniciativas de Archivos Abiertos (OAI)

Digitalizacin
Parte importante en la construccin de una biblioteca digital ser el anlisis de las mejores tcnicas, formatos, software y hardware que se utilizarn en la digitalizacin de los diversos tipos de informacin.
Se deben considerar los aspectos de preservacin, difusin de la informacin a travs de la red, as como, los derechos de autor. Es decir, en una planificacin hay que considerar e investigar las mejores prcticas para la digitalizacin, dependiendo de los objetivos, metas del proyecto.

Digitalizacin
Errores en la digitalizacin
- Subestimacin del trabajo - Subestimacin del espacio - Equipos inapropiados - No se disea la metodologa - Control de calidad insuficiente - Base de datos en lugar de base de informacin - No se disean los mecanismos de supervisin

Digitalizacin
PRESERVACIN DIGITAL
La preservacin de la informacin digital es un problema difcil y no muy bien entendido. La informacin codificada en formato digital es poco probable que dure mas de una dcada o dos: Razones - Envejecimiento de los soportes digitales - Obsolescencia de los formatos - Obsolescencia de software y hardware

- Falta de compatibilidad hacia atrs de los sistemas nuevos

Estndares de metadatos
Algunas caractersticas de los metadatos

Integran varias de las actividades del proceso analtico-sinttico de la informacin.

Catalogacin
Clasificacin Indexacin Redaccin de resmenes Pueden ser utilizados por personas con poco conocimiento de procesamiento de la informacin.

Interfaces
Interfaz de captura o ingreso de metadatos
Permite el ingreso de registros de metadatos con el sistema o modelo seleccionado, y el mantenimiento de la base de datos por parte del bibliotecario o intermediario de la informacin, donde se ligan los registros con los objetos digitales.

Interfaz de acceso para el usuario final, debe considerar la recuperacin desde la forma ms sencilla para usuarios inexpertos y expertos

Interfaces
Interfaz del usuario
Es en realidad la biblioteca digital para el usuario en la cual puede interactuar con las opciones de acceso a los contenidos que se almacenaron y que se disponen a por medio de diferentes puntos de acceso: - Catlogo bibliogrfico, temas, ttulos, autores, etc. - Bases de datos de diferentes tipos - Consultas a travs de metadatos - Consultas al texto completo - Consultas a otros recursos pertinentes, segn la temtica de la biblioteca - Consultas a otras bibliotecas digitales - Tanto a recursos propios como externos (comerciales o de libre acceso)

Servicios
Los servicios de informacin que ofrece la biblioteca digital depender de los objetivos y metas planteados en la creacin de la biblioteca y de la institucin, entidad, empresa, etc. Depender de la comunidad de usuarios a las que esta dirigido
Depender la infraestructura, recursos humanos disponibles (acceso en cualquier lugar, las 24 hrs. de los 365 das del ao, etc.) Depender del acceso abierto, de acceso restringido, con autentificacin a uno, algunos o todos los servicios.

Servicios
Algunos de los servicios mas comunes

Consulta al catlogo (reserva de libros, etc.) Consultas a catlogos de material audiovisual Consulta a bases de datos (referenciales, texto completo, multimediales) Consulta al catlogo de publicaciones peridicas, tesis Consulta a documentos en texto completo Consulta nuevas adquisiciones, directorios, listas, etc. Servicios de diseminacin de informacin (ges).

Comunidades de usuarios
El objetivo de una biblioteca digital esta dirigido a la comunidad de usuarios que utilizar sus contenidos, servicios, a travs de interfaces con tecnologas de redes informticas y de telecomunicaciones y poder satisfacer las necesidades de informacin por la cual fue creada. Es decir, una traduccin al mundo digital de las funciones de una biblioteca tradicional.

Comunidades de usuarios
Las comunidades de usuarios es un tema poco desarrollado por quienes construyen bibliotecas digitales, dirigidas a usuarios potenciales, sean estos:
Bibliotecas digitales de universidades (Maestros-investigadores, alumnos, etc.) Bibliotecas digitales nacionales (poblacin de un pas) Bibliotecas digitales especializadas, temticas (dirigidas a una comunidad de especialistas)

Arquitectura de la informacin
El trmino Arquitectura de la Informacin (AI) fue utilizada por primera por Richard Saul Wurman en 1975, quin la define como: El estudio de la organizacin de la informacin con el objetivo de permitir al usuario encontrar su va de navegacin hacia el conocimiento y la comprensin de la informacin Una de las definiciones que Louis Rosenfield y Meter Morville ofrecen Ens. Libro Informacin Architecture for the World Wide Web 2nd Edition, es, El arte y la ciencia de estructurar y clasificar sitios intranets con el fin de ayudar a los usuarios a encontrar y manejar la informacin.

Arquitectura de la informacin
La Arquitectura de la informacin (AI) contempla la organizacin de la informacin desde una perspectiva amplia, incluye tanto a la estructura propuesta para el contenido como los mecanismos necesarios para conocer y explorar dicha estructura en su presentacin visual. Aunque existen diferentes propuestas de arquitectura, cualquiera que se utilice abarca:

La organizacin de la informacin El sistema de navegacin El sistema de etiquetado de contenidos El sistema de bsqueda y recuperacin

Arquitectura de la informacin en Bibliotecas Digitales


La arquitectura de las bibliotecas virtuales posee dos aspectos; La arquitectura del edificio de la biblioteca virtual (Sitio Web) y La arquitectura de la informacin, sus contenidos, cmo estn almacenados, organizados

El edificio es creado, a diferencia del edificio fsico por diseadores, programadores, telemticos, informticos, inclusive pedagogos, todo con el afn, de que sea un sitio atractivo para los usuarios Arquitectura de la informacin en una biblioteca virtual, ser la forma en que los usuarios podrn acceder a los contenidos

FIN