Documente Academic
Documente Profesional
Documente Cultură
Sumario
Introduccin a DSpace
Funcionalidades Personalizacin Herramientas administrativas (scripts) Conclusin
Introduccin a DSpace
Software en cdigo abierto para implementar depsitos digitales. Objetivo: Coleccionar y organizar la produccin intelectual de una institucin, describirla, diseminar y preservar sus objetos digitales. Actualmente en la versin estable 1.4.2. Versin 1.5 en fase alfa
Modelo de Datos I
La informacin que almacena DSpace est estructura en 5 componentes bsicos: 1.- Comunidades/subcomunidades (conjunto de colecciones y subcomunidades) 2.- Colecciones (agrupaciones de tems con un workflow en comn)
Modelo de Datos II
Visin general I
Dos interfaces web: JSPUI / XMLUI (Manakin) Interfaz web bastante completa: mostrar el contenido, aadir nuevo y administrar. XHTML 1.0 y WAI Multilenguage Motor de bsqueda, basado en lucene, indexacin de texto completo ndices de navegacin: ttulo, autor, materia y fecha (configurable) RSS OAI-PMH Herramientas de importacin e exportacin de tems Herramientas de exportacin en diferentes formatos en XML (METS, MODS. DCQ, MPEG-21)
Ecologa de los repositorios institucionales. Gijn, diciembre del 2007
Visin general II
Nivel coleccin / comunidad Pgina propia para las comunidades y colecciones: posibilidad aadir logo, texto personalizados,... Alertas por coleccin RSS a nivel de coleccin y de comunidad ndices de navegacin y bsquedas acotados a nivel de coleccin y comunidad Nivel de tem Diferentes niveles de acceso: abierto, solo metadatos,... Recomendar un tem OpenURL Handle: identificadores persistentes Metadatos: nivel simple (configurable) /nivel completo Licencias creative commons
Ecologa de los repositorios institucionales. Gijn, diciembre del 2007
Metadatos I
Metadatos II
Un metadato en DSpace tiene asociado:
Valor
Autorizacin
Existen dos grupos especiales, annimo, administradores. Se pueden crear grupos a partir de otros grupos. Modelo flexible:
Para la mayora de objetos del modelo de datos es posible dar permisos de lectura, insercin, edicin, borrado. En el caso de las colecciones existe el rol administrador de coleccin. En el caso de los tems es posible definir diferentes niveles de lectura: restringir el acceso al texto completo o a todo.
Ecologa de los repositorios institucionales. Gijn, diciembre del 2007
Autenticacin
Certificados X.509
Sistema basado en IP (versin 1.5)
Formulario de envo
Seleccin de la coleccin Preguntas previas Metadatos (2 pasos) Inclusin de archivos Revisin Seleccin Licencia Creative Commons (opcional) Aceptacin licencia final
El formulario de metadatos es configurable mediante un archivo de configuracin propio. Ahora lo veremos... En la versin 1.5 tambin es posible modificar/adaptar estos pasos mediante otro archivo de configuracin. Incluir nuevos pasos, modificarlos, ...
Ecologa de los repositorios institucionales. Gijn, diciembre del 2007
Workflow
Paso 1: aceptar / rechazar envo Paso 2: aceptar / rechazar envo + editar metadatos Paso 3: editar metadatos
A nivel de coleccin, por cada coleccin se puede definir que pasos estn activos. Cada paso se asocia un conjunto de usuarios Se pueden definir un conjunto de metadatos por defecto Se puede modificar a travs de la interfaz de usuario.
Ecologa de los repositorios institucionales. Gijn, diciembre del 2007
OAI-PMH
Manakin I
Un nueva interfaz web de DSpace basada en XML Apache Coocon, XSL, CSS
Interfaz JSP
La interfaz JSP es difcil y costosa de modificar y extender. Una interfaz nica para todas las colecciones a pesar de poder tener diferente contenido
Manakin
Manakin II
Tres componentes bsicos
Aspects Son los generadores de contenido en XML Implementan un conjunto de funcionalidades relacionadas
Esquema DRI (Digital Repository Interface) Representacin abstracta en XML de la pgina del repositorio Es la entrada y salida de los aspects
Tema: definen como se visualiza el contenido
Sitemap.xml: fichero de configuracin del tema Hoja(s) de estilo XSL: transforma el DRI Schema (XML) en HTML Hoja de estilo CSS: determina la visualizacin final
Manakin III
Archivo xmlui.conf
Localizacin carpetas
Hay que tener en cuenta que diferentes partes de DSpace residen en diferentes zonas del servidor:
[dspace-source]: el cdigo fuente de DSpace, aqu se deben realizar los cambios / personalizaciones de la interfaz [tomcat]: donde estn las interfaces web de DSpace funcionando [dspace]: contiene los archivos de configuracin (dspace.cfg, inputforms.xml, ...), scripts de administracin, archivos almacenados, ...
Archivo configuracin
Archivo [dspace]/config/dspace.cfg
Aqu estn:
La configuracin bsica Funcionalidades que se pueden activar o desactivar La configuracin de las interfaz
Cada par clave valor debe ir en una sola linea, si no se debe escapar con \
[dspace-source]/jsp/layout/*.jsp archivos comunes casi todas las pginas [dspace-source]/jsp/styles.css.jsp hoja de estilo
Los archivos modificados se deberan guardar en [dspace-source]/jsp/local/... Despus de realizar los cambios se debe recompilar y volver a copiar la interfaz en el webapp del tomcat.
Ecologa de los repositorios institucionales. Gijn, diciembre del 2007
Cambiar texto
Es un listado de claves-valor:
jsp.home.com1 = Communities in DSpace jsp.home.com2 = Choose a community to browse its collections.
Internacionalizacin
Para incluir o cambiar la traduccin en castellano se debe incluir una rplica del archivo Messages.properties traducido:
[dspace-source]/config/language-pack/Messages_es.properties
La interfaz se mostrar en el idioma en que este configurado el navegador web. Para incluir un selector de idioma, se debe instalar un parche:
[ Patch 1450491 ] i18n configurable multilingualism support
Versin 1.5:
Ya incluye el parche para hacer la plataforma multilenguaje La interfaz XML (manakin) tiene su propio archivo de textos diferenciado. En formato xml.
[dspace-source]/dspace-xmlui/dspace-xmlui-webapp/src/main/webapp/i18n/messages.xml
En la interfaz jsp es posible modificar los metadatos que se muestran en la visualizacin simple de un tem modificando una clave del archivo dspace.cfg:
webui.itemdisplay.default = dc.title, dc.title.alternative, dc.contributor.*, \ dc.subject, dc.date.issued(date), dc.publisher, \ dc.identifier.citation, dc.relation.ispartofseries, \ dc.description.abstract, dc.description, \ dc.identifier.govdoc, dc.identifier.uri(link), \ dc.identifier.isbn, dc.identifier.issn, \ dc.identifier.ismn, dc.identifier
(link) -> el metadato se mostrar como un enlace (date) -> el metadato se mostrar como una fecha en el idioma en que se este mostrando la interfaz
webui.itemdisplay.tutorial.collections = 123456789/3 webui.itemdisplay.tutorial = dc.title, dc.contributor.*, \ dc.relation.ispartof, dc.identifier.citation, \ dc.description.tableofcontents, my.custom.metadata, \ dc.identifier.uri(link)
Etiquetas ??? alguna.clave.exto??? Si se incluyen nuevos metadatos a mostrar es necesario incluir las claves i18n en el archivo de textos de la interfaz (Messages.properties):
metadata.<schema>.<element>.<qualifier> = ... (ej.: metadata.dc.title, metadata.dc.identifier.citation)
Ecologa de los repositorios institucionales. Gijn, diciembre del 2007
Bsqueda e ndices
Bsqueda
DSpace utiliza un motor de bsqueda basado en Lucene. Lucene crea un conjunto de ndices que guarda en [dspace]/search
ndices de navegacin
Tambin dispone de ndices para la navegacin a partir de ciertos metadatos del tem: listado por ttulo, fecha de publicacin, autor y materia. Estos ndices se guardan en tablas de la base de datos.
Bsqueda I
Definir los ndices que queremos tener:
Para un ndice se puede asignar ms de un metadato creando ms de una entrada de search.index. (ejemplo ndice author)
En lugar de qualifier se puede incluir * para indexar cualquier metadato con ese elemento La configuracin bsica utiliza otro ndice llamado default que contiene:
Todos los ndices definidos El texto completo extrado El nombre de las comunidades y colecciones
Ecologa de los repositorios institucionales. Gijn, diciembre del 2007
Bsqueda II
Si se incluyen nuevos ndices, para que aparezcan en la interfaz es necesario modificar el archivo que genera el formulario de bsqueda avanzada. No se incluye automticamente!
Ecologa de los repositorios institucionales. Gijn, diciembre del 2007
ndices de navegacin I
Actualmente ofrece 4 ndices de navegacin (ttulo, autor, materia, fecha) A travs de dspace.cfg se puede elegir que metadatos utiliza:
webui.browse.index.date = dc.date.issued webui.browse.index.author = dc.contributor.*
webui.browse.index.title = dc.title
webui.browse.index.subject = dc.subject.*
ndices de navegacin II
En la versin 1.5 se han incluido varias mejoras para hacer estos ndices ms configurables:
Se puede crear ms ndices (no solo los 4 que vienen por defecto).
Definir para que campos se pueden ordenar los listados y como se ordenan estos campos Ms opciones sobre como mostrar los ndices (nmero de autores que muestra, longitud mxima de campo listado, ... )
Bsqueda e ndices
Cada vez que realizamos algn cambio en la configuracin que afecta a la bsqueda o a los ndices de navegacin es necesario re-indexar mediante el script index-all:
[dspace]/bin/index-all
En la versin 1.5 el cambio en la configuracin de ndices puede implicar que se deban cambiar algunas tablas. Se puede utilizar este comando para reconstruir las tablas:
[dspace]/bin/dsrun org.dspace.browse.IndexBrowse f r
Formulario de envo I
Para modificar el formulario de envo es necesario modificar el archivo de configuracin [dspace]/config/input-forms.xml
<form-map> <name-map collection-handle="default" form-name="traditional" /> ... </form-map> <form-definitions> <form me="traditional"> <page> ... <field> ... <field> <page> </form> </form-definitions>
Parte3: <form-value-pairs> Definicin de pares de valores <value-pairs value-pairs-name="common_iso_languages" dc-term="language_iso ... para los campos controlados
</form-value-pairs> </input-forms>
Formulario de envo II
La etiqueta field:
<field> <dc-schema>dc</dc-schema> El nombre del esquema
<dc-element>contributor</dc-element> El elemento del metadato <dc-qualifier>author</dc-qualifier> <repeatable>true</repeatable> <label>Authors</label> <input-type>name</input-type> El cualificador del metadato. Puede estar vaco. Si es o no repetible La etiqueta que se muestra El tipo de campo
<hint>Enter the names of the authors Texto de ayuda, instrucciones de que se debe incluir of this item The help text to be showed to exactamente. the submitter below.</hint> <required></required> <visibility><visibility> </field>
Ecologa de los repositorios institucionales. Gijn, diciembre del 2007
Texto que se muestra si no se ha rellenado el campo. Si no hay nada el campo es opcional. Opcional. Para indicar si es visible solo durante el envo o la revisin
Campo de texto libre: onebox : un campo simple de texto (ej.: ttulo) twobox: dos campos simples de texto (ej.: materias) textarea: campo de texto largo (ej.: abstract, resumen) Campo de datos especficos name: nombre de personas (apellido, nombre) date: fecha Campos de datos con valores controlados dropdown : un seleccionable list: implementado como checkbox o radio button qualdrop_value : compuesto de un seleccionable para escoger el cualificador, y un campo de texto para introducir el valor
Ecologa de los repositorios institucionales. Gijn, diciembre del 2007
Formulario de envo IV
Las vocabularios controlados estn definidos en archivos xml en [dspace]/config/controlled-vocabulary/ y tiene esta forma:
<node id="acmccs98" label="ACMCCS98"> <isComposedBy> <node id="A." label="General Literature"> <isComposedBy> <node id="A.0" label="GENERAL"/> <node id="A.1" label="INTRODUCTORY AND SURVEY"/> ... </isComposedBy> </node> ... </isComposedBy> </node>
Formulario de envo V
Scripts I
A parte de la interfaz web DSpace incorpora un conjunto de utilidades de administracin ejecutables a travs de lnea de comandos
Se trata en su mayora de clases java ejecutables que se deben usar mediante el script dsrun:
[dspace]/bin/dsrun org.dspace.administer.CommunityFiliator
Scripts II
import export create-administrator index-all packager Importacin /exportacin de tems mediante archivos en xml. Crear un administrador Re-construir los ndices de DSpace (bsqueda y navegacin) Otro script de importacin que permite importar tems empaquetados (archivos comprimidos, PDF, ...) Creacin de estructura de comunidades colecciones
ItemImport
[dspace]/bin/dsrun org.dspace.app.itemimport -a -w -c <coleccion> -e <eperson> -s <ruta> -m mapfile O [dspace]/bin/import -a -w -c <coleccion> -e <eperson> -s <ruta> -m mapfile
dublin_core.xml xml con los metadatos contents listado de archivos a cargar archivos a cargar
Filter-media
[dspace]/bin/filter-media
Actualmente usado para: Extraer el texto de los archivos para poder hacer bsquedas Extraccin de miniaturas de imgenes para su visualizacin en listados Extraccin / creacin de imgenes con texto incrustado Tambin lanza una re-indexacin.
Configurable en [dspace]/config/dspace.cfg
#Configure each filter's input format(s) filter.org.dspace.app.mediafilter.PDFFilter.inputFormats = Adobe PDF filter.org.dspace.app.mediafilter.HTMLFilter.inputFormats = HTML, Text filter.org.dspace.app.mediafilter.WordFilter.inputFormats = Microsoft Word filter.org.dspace.app.mediafilter.JPEGFilter.inputFormats = BMP, GIF, JPEG, imagen/png filter.org.dspace.app.mediafilter.BrandedPreviewJPEGFilter.inputFormats = BMP, GIF, JPEG, imagen/png
Ecologa de los repositorios institucionales. Gijn, diciembre del 2007
Versiones Futuras
DSpace 1.5 (alpha) Reestructuracin del cdigo (separacin en mdulos y uso de Maven) dspace dspace-api language-pack: dspace-jspui dspace-oai dspace-xmlui (Manakin) dspace-lni (webservice basado en WebDav) i18n multilingualism support Configurable item submission Configurable Browse ... DSpace 1.6 (en proceso)
Documentacin
DSpace Basic Tutorial DSUG Rome 2007 ( Andrea Bollini, Federico Meschini)
DSpace 1.4.1 - Customization ( Claudia Jrgen) Dspace How-to Guide (Tim Donohue, Scott Phillips, Dorothea Salo). Traducido al castellano (Luis Tijera ,Universidad de Len) Learning to use Manakin -DSUG Rome 2007 (Scott Phillips)
Recursos generales
DSpace.org http://www.dspace.org DSpace wiki http://wiki.dspace.org Documentacin DSpace. (en [dspace-source]/doc) Sourceforge.net http://sourceforge.net/projects/dspace Listas de distribucin: http://www.dspace.org/feedback/mailing.html dspace-general dspace-tech dspace-devel En castellano