DSpace es una plataforma de código abierto que permite crear repositorios institucionales para almacenar y preservar documentos digitales. Fue desarrollado originalmente por el MIT y HP en 2002. DSpace permite gestionar comunidades, colecciones e ítems con metadatos, y ofrece características como búsqueda, flujos de trabajo para revisión, preservación a largo plazo e interoperabilidad con otros sistemas a través de protocolos como OAI-PMH. Los repositorios creados con DSpace proporcion
Introducción a DSpace - Universidad Nacional del Altiplano, Puno
1. Universidad Nacional del Altiplano Puno
Curso DSpace
Título: Introducción a DSpace
Presenta: Elwin L. Huaman Quispe 1
2. Objetivos de este curso
Al final de esta presentación el participante:
● Conocerá la historia de DSpace
● Entenderá que es DSpace, y para qué puede ser usado
● Conocerá sobre la instalación de DSpace
● Conocerá las características de DSpace y como está organizado
● Sabrá conceptos básicos sobre Repositorios Institucionales (RI)
● Sabrá las ventajas que supone implementar un RI
● Otros.
2
3. Un poco de Historia
3
● 2002, Desarrollado por MIT y HP
● 2005, DSpace 1.3
● 2007 Julio, HP y MIT fundaron DSpace Foundation (soporte)
● 2009 Mayo, Fedora Commons y la Fundación DSpace crearon la DuraSpace que
tiene la misión de proporcionar liderazgo e innovacion en tecnologias open
source principalmente para bibliotecas, centros de investigación y
organizaciones de patrimonio cultural.
● 2016 Marzo, La última versión estable es la 5.4 Link
4. Conceptos clave
4
● Repositorio: Un repositorio es una infraestructura web capaz de brindar un
conjunto de servicios a una comunidad, destinados a recopilar, gestionar,
difundir y preservar contenidos a través de una colección organizada y
accesible en abierto y que pueda interoperar con otros repositorios.
● Preservación: Conjunto de prácticas de naturaleza política, estratégica y
acciones concretas, destinadas a asegurar el acceso a los objetos digitales a largo
plazo(UNESCO:Directrices para la preservación del Patrimonio Digital).
● Item: Es un elemento (Documento digital) que puede ser texto, imagen, audio, etc.
● Persistencia: El uso de un sistema de identificación único y persistente para
cada ítem.
● Derechos de Autor.
5. Concytec
5
● La recolección de metadatos son válidos según las directrices de DRIVER 2.0 y
el esquema de metadatos Dublin Core.
● DRIVER(Digital Repository Infrastructure Vision for European Research)
financiado por la UE que crea un marco de trabajo tecnológico organizativo en
el ámbito de la investigación y la educación superior.
● Dublin Core (DC): es un modelo de metadatos elaborado y auspiciado por la
DCMI (Dublin Core Metadata Initiative), es un sistema de 15 definiciones
semánticas descriptivas que pretenden transmitir un significado semántico a las
mismas.
7. ¿Qué es DSpace?
● DSpace es una plataforma (software de código abierto) que permite la
administración de ítems en cualquier formato (texto, video, audio y datos),
distribuirlos en la web, e indexarlos.
● DSpace es típicamente usado como un Repositorio Institucional. Teniendo 3
principales funciones:
○ Facilitar la captura y consumo de materiales, incluyendo metadatos
○ Facilitar el fácil acceso a los materiales
○ Facilitar la preservación a largo plazo de los materiales
● Puede almacenar:
○ Artículos de revistas, Tesis digitales, Carteles de Conferencias
○ Conjuntos de datos (Data sets), Informes
○ Videos, Imagenes
○ Otros documentos digitales
7
11. Arquitectura: Capa de almacenamiento
11
Interacción con la base de datos
● Items y sus metadatos
● Personas y grupos
● Información de autorización
● Trabajos en curso (workflow)
● Índices de búsqueda y exploración
12. Arquitectura: Capa de Lógica de Negocios
12
Ofrece
● Administración
● Búsqueda
● Exploración
● Gestión de usuarios y grupos
● Autorización
● Carga de documentos
● Workflow
● Handle manager
● Abstracción en Comunidades, Colecciones e
● Items
13. Arquitectura: Capa de Aplicación
13
Conjunto de módulos que permiten la interacción con el mundo exterior
● Aplicación web: JSPUI y XMLUI
● OAI-PMH Data Provider
● Estadísticas
● Importar/Exportar
● MediaFilter
14. Modelo de Datos
14
Caracteristicas
● Las comunidades pueden contener
subcomunidades o colecciones,
pero no ítems
● Las colecciones sólo pueden
contener ítems
● Un ítem pertenece a una sola
colección, pero puede estar
asociado a otras colecciones.
16. Gestión de Usuarios
16
● Denominados E-Person
● Agrupados en E-Group
Un E-Group puede contener:
● múltiples E-Person
● otros E-Group
Un E-Person puede pertenecer a muchos grupos (directa o indirectamente)
17. Gestión de Autorizaciones
17
Listado de derechos con tres elementos
(Objeto, Usuario, Derecho)
Objeto puede ser:
● Comunidad
● Colección
● Item
● Bitstream
Usuario puede ser:
● E-Person
● E-Group
Derecho puede ser:
● READ: ver o descargar
● WRITE: modificar datos
● ADD: agregar a un contenedor
● REMOVE: eliminar de un contenedor
● ADMIN: administración de
elementos
18. Gestión de Autorizaciones
18
● Existen dos grupos del sistema: Anonymous, Administrator
● Todos los usuarios pertenecen al grupo Anonymous
● Por defecto, todas las comunidades, colecciones e ítems tienen permiso de
READ para el grupo Anonymous
● Existen Derechos especiales para el Workflow
19. Roles de Usuarios
19
● Administradores: tiene control sobre el elemento que administra
○ Administrador del sitio
○ Administrador de comunidad
○ Administrador de colección
● Revisores: usuarios asociados a algún paso del workflow de revisión
● Submitters: pueden realizar envíos de documentos en alguna colección
● Anónimos: tienen acceso de sólo lectura (incluye a los usuarios registrados que
sólo pertenecen al grupo Anonymous)
Se definen según el grupo de pertenencia del usuario y las autorizaciones que dicho
grupo (o el usuario mismo) posea en el sistema. Un usuario es considerado Submitter
sólo si tiene permiso de ADD en alguna colección
20. 2 opciones: original y configurable
Versión por defecto: 3 pasos de revisión
● Sólo visualización, aceptación o rechazo
● Edición de metadatos, aceptación o rechazo
● Edición de metadatos y aceptación (no se permite el rechazo)
Lista general de tareas pendientes
● Cualquier revisor puede asignarse una tarea disponible
● Un revisor en cualquier momento puede liberar una tarea
Flujo de Trabajo de Revisión
20
21. 2 opciones: original y configurable
Versión por defecto: 3 pasos de revisión
● Sólo visualización, aceptación o rechazo
● Edición de metadatos, aceptación o rechazo
● Edición de metadatos y aceptación (no se permite el rechazo)
Lista general de tareas pendientes
● Cualquier revisor puede asignarse una tarea disponible(permiso)
● Un revisor en cualquier momento puede liberar una tarea
● Rechazo del ítem (carga incompleta y envio de mail)
Flujo de Trabajo de Revisión
21
22. El Workflow configurable permite:
● Definir un conjunto de roles
● Definir un scope para los roles
○ repository: debe ser un grupo existente en el repositorio
○ collection: se asigna por colección
○ ítem: se asume que algún paso en el workflow asignará una persona o grupo
● para revisar un ítem en particular
Flujo de Trabajo de Revisión(Configurable)
22
23. Provisto por el módulo de Discovery
● Aporta una mejora considerable en el tiempo de respuesta en las búsquedas
● Capacidad para personalizar la interpretación de las consultas
● Sugerencias de búsquedas
● Facilidades para faceting de textos, números y fechas
● Importante incremento en las capacidades de búsqueda usando los filtros en la
indexación
○ stemmer
○ edge n-grams
○ stop words
○ sinónimos
○ tokenizing
Integración: Apache Solr
23
24. Características de DSpace
24
OAI-PMH
● Open Access Initiative - Protocol metadata Harvesting (Iniciativa de Acceso
Abierto - Protocolo para la recolección de metadatos).
● Es una herramienta de interoperabilidad independiente de la aplicación que
permite realizar el intercambio de información para que desde puntos
(Proveedores de datos), se puedan recuperar la información de los items.
● Ofrece a los proveedores de datos una opción para poner sus metadatos a
disposición de servicios basados en lso estandares abiertos HTTP y XML.
● Este protocolo obliga a que los archivos individuales mapeen sus metadatos en
Dublin Core.
25. Sistema Handle
25
● El Sistema Handle es un sistema que permite la asignación de identificadores
persistentes a los recursos de información u objetos digitales existentes en
Internet (artículos, revistas, imágenes, etc.).
● Desarrollado por CNRI (Corporation for National Research Initiatives), se
estructura en dos partes:
○ - Prefijo (Prefix): identifica al productor del identificador (universidad, editorial, revista, etc.)
○ - Sufijo (Suffix): identifica a cada uno de los documentos u obras digitales (artículo, libro,
capítulo, etc.)
27. Beneficios de Usar DSpace
27
● Coleccion on-line (24/7)
● Recuperar tu consulta rapidamente
● Acceso global, gran visibilidad y accesibilidad
● Almacenamiento de casi todo tipo de materiales
● Gestionar y distribuir los items
● Tener un identificador persistente (HANDLE)
● Preservación digital
● Sindicación de contenidos RSS
● Permite la Interoperabilidad (OAI-PMH)
● Estadisticas de uso
28. Sugerencia
28
Metadatos Tradicionales
● ID
● Título
● Autor
● Idioma
● Fecha
● etc.
Metadatos de preservación
● Procedencia
● Autenticidad
● Contexto
● Gestion de derechos
● Actividades de Preservación
Metadatos y Metadatos de Preservación
29. “Sin bibliotecas, ¿Que nos quedaría?; no
tendríamos pasado ni futuro”
- (Ray Bradbury)
29