El documento describe varios proyectos cooperativos de ciencia abierta en Cataluña liderados por el CSUC, incluyendo repositorios institucionales y temáticos para tesis doctorales, publicaciones periódicas, datos de investigación, y herramientas para la gestión de datos. El CSUC ha trabajado durante 20 años para promover la ciencia abierta a través de la creación de estos servicios y proyectos cooperativos que comparten recursos para apoyar a la comunidad investigadora catalana.
Proyectos cooperativos de ciencia abierta Cataluña
1. Proyectos cooperativos de ciencia
abierta en Catalunya
Ricard de la Vega
Jefe de Càlculo y Aplicaciones
2. Índice
• El CSUC y la ciencia abierta
• Los servicios y proyectos
– Repositorios institucionales y temáticos
– Repositorios de publicaciones periódicas
– Repositorios de datos y DMPs
– Ciencia abierta y datos abiertos
• 5 características comunes de los proyectos
• Referencias
3. Índice
• El CSUC y la ciencia abierta
• Los servicios y proyectos
– Repositorios institucionales y temáticos
– Repositorios de publicaciones periódicas
– Repositorios de datos y DMPs
– Ciencia abierta y datos abiertos
• 5 características comunes de los proyectos
• Referencias
4. Um pequeno país
Habitantes en milhões
200 M
12 M
7,5 M
Un país petit, Lluís Llach
https://www.youtube.com/watch?v=bVs26HkF1ho
5.
6.
7. Universidades en Cataluña
Universitat de Barcelona (UB)
Universitat Autònoma de Barcelona (UAB)
Universitat Politècnica de Catalunya (UPC)
Universitat Pompeu Fabra (UPF)
Universitat de Girona (UdG)
Universitat Rovira i Virgili (URV)
Universitat de Lleida (UdL)
Universitat Oberta de Catalunya (UOC)
Universitat Ramon Llull (URL)
Universitat de Vic (UVic)
9. El CSUC
El CSUC es un consorcio público integrado por 10 universidades catalanas y
el Gobierno de Cataluña con la misión de compartir o mancomunar servicios
académicos, bibliotecarios, de transferencia del conocimiento y de gestión de
las entidades consorciadas para potenciar sinergias y mejorar la eficiencia.
Cálculo
Científico
Comunicaciones
Infraestructuras
TIC
Contrataciones y
Compras conjuntas
Ciencia
Abierta
10. El CSUC y la Ciencia Abierta
• Desde 1999 trabaja para la promoción y gestión de diferentes
actividades relacionadas con la investigación:
– Creación de repositorios y portales cooperativos
• Tesis Doctorales en Red (TDX, 30.000 tesis)
• Revistas Catalanas en Acceso Abierto (RACO, 500 revistas)
• …
– Cumplimiento de mandatos de Acceso Abierto
– Portal de la Investigación de Catalunya
• En 2014 se crea una línea estratégica de actuaciones de apoyo a la
investigación
• En 2017 se crea una nueva área organizativa: Ciencia Abierta
11. Área de Ciencia Abierta del CSUC
• Misión: Colaborar con las universidades para disminuir el
esfuerzo de adaptación a los requisitos de la Ciencia Abierta
• Principios rectores:
– Explorar conjuntamente
– Compartir buenas prácticas
– Construir soluciones conjuntas (si es el caso)
12. Índice
• El CSUC y la ciencia abierta
• Los servicios y proyectos
– Repositorios institucionales y temáticos
– Repositorios de publicaciones periódicas
– Repositorios de datos y DMPs
– Ciencia abierta y datos abiertos
• 5 características comunes de los proyectos
• Referencias
20. Who we are?
All the code, specifications and documentation are available
under an open source MIT license on the Github Echoes
page: https://github.com/CSUC/ECHOES-Tools
Technological partner
21. What is Echoes?
Echoes is a project of interoperability between
different data collections.
Integrating data is not just about putting them
together in a repository, but also to facilitate
their access so it can be properly exploited by
the public
23. What’s this?
What's this?
a) A flower?
b) A black hole?
c) A (not user friendly)
data visualization of a
450K nodes graph?
24. Some Echoes Challenges…
1. Different metadata schemas
2. Poor data quality
3. Data deduplication
4. Automatic enrichment
5. Too much data
6. Easy SPARQL queries
7. Different scope
8. User enrichment
28. How Echoes works?
Data access
Data storage (Blazegraph)
Data homogenization
Data collections
4
3
2
1
29. Data Homogenization
Analyze Transform
Quality
Assurance
Enrich Publish
1 42 3 5
Analyze
content from
a source to
“know about”
your data
Download
items into
local files
from a
source
Transform to
EDM
Review each
item and
based on
defined rules
decide if it can
be loaded into
Data Lake
Quality report
Enrich
metadata
from different
sources
Publish items
into Data Lake
Only valid
items can be
loaded
Optional Optional Optional
Demo on https://youtu.be/LQSheaKJOiY
37. C
Revistas Catalanas en Acceso Abierto
1999: el CBUC pone en funcionamiento una BBDD de
sumarios electrónicos
2001: por 1ª vez se añaden artículos a un sumario
de revista. En 2004, son 35 las revistas con
texto completo
2004: proyecto de RACO
2005: RACO recibe una subvención de la Generalitat
(Biblioteca Cataluña + CESCA + CBUC)
2006: RACO abre al público usando OJS
38. C
Revistas Catalanas en Acceso Abierto
2006-2010: Ayudas para la digitalización de revistas
– 36 revistas con un total de 500.000 páginas
– Digitalización + introducción en RACO
2008-20xx: el Acceso Abierto adquiere importancia
2011: Creación del Consejo editorial de RACO
2012: Actualización interfície (OJS versión 2.3.7)
2019: En octubre, actualización interfície (OJS versión 3)
42. C
RACO actualmente
503 revistas
⁻ revistas científicas y de ‘alta cultura’ editadas por una
institución científica, cultural y / o erudita catalana o
publicadas en catalán o relacionadas por historia o
por temática con la cultura catalana
⁻ Por acuerdo de un comité editorial
223.306 artículos (un 90,31% a texto completo)
43. C
RACO actualmente
95 instituciones
– Entidades de la Generalitat de Catalunya (8)
– Academias, asociaciones y sociedades (22)
– Centros de estudios locales (5)
– Institutos y centros especializados (22)
– Colegios profesionales (5)
– Museos y Archivos (15)
– Fundaciones (3)
– Universidades (14)
– Ayuntamientos (1)
44. C
El “valor” de RACO actualmente
• Su tamaño da visibilidad a las revistas incorporadas (el
concepto de atracción gravitacional de L. Dempsey)
• Es una “marca”. Estar (en RACO) es ser una revista
académica
• Proporciona infraestructura que muchas revistas no se
podrían permitir
– estar en internet, estadísticas de usos, preservación, …
– Servicios de valor añadido
45. 3- Repositorios de datos de investigación
TESISDOCTORALESENRED(TDX)
REPOSITORIODELAINVESTIGACIÓNDECATALUNYA(RECERCAT)
REVISTASCATALANASENACCESOABIERTO(RACO)
PATRIMONIODIGITALDECATALUÑA(PADICAT)
REVISTASESPAÑOLASDECIENCIAYTECNOLOGÍA(RECYT)
MEMORIADIGITALDECATALUNYA(MDC)
MATERIALDOCENTEENRED(MDX)
PATRIMONIODIGITALDECIENCIAYTECNOLOGÍA(PADICYT)
REPOSITORIODELDEPT.CULTURAGOBIERNO(CALAIX)
REPOSITORIODELAFILMOTECADECATALUNYA
REPOSITORIODELDEPT.DESALUTDELGOBIERNO(SCIENTIA)
REPOSITORIODELMUSEODEARTECONTEMPORANEODEBCN(MACBA)
PORTALDELAINVESTIGACIÓNDECATALUNYA
REVISTASDELAESCUELADEADMINISTRACIÓNPÚBLICA(EAP)
PRESERVACIÓNDEFILMS(FILMOTECA)
3*REPOSITORIOSDEPRESTACIONESBÁSICAS(DSpaceaaS)
DATAMANAGEMENTPLANSTOOL(DMP)
INTEGRACIONDECOLECCIONESHETEROGENEASDEPATRIMONIO(ECHOES)
REPOSITORIOGABINETETÉCNICODEPT.CULTURAGOBIERNO(DRAC)
REPOSITORIODEDATOS
46. Aproximación asimétrica a RDM
1. Planes de gestión de datos (DMP)
2. Recomendaciones para seleccionar un
repositorio existente
3. Ampliación repositorios institucionales
4. Creación de un repositorio FAIR consorciado
5. Ampliación para la gestión de todo el ciclo de
vida de los datos
Tamaño y
complejidad
Núm.. de proyectos
47. Aproximación asimétrica a RDM
1. Planes de gestión de datos (DMP)
2. Recomendaciones para seleccionar un
repositorio existente
3. Ampliación repositorios institucionales
4. Creación de un repositorio FAIR consorciado
5. Ampliación para la gestión de todo el ciclo de
vida de los datos
Tamaño y
complejidad
Núm.. de proyectos
49. Aproximación asimétrica a RDM
1. Planes de gestión de datos (DMP)
2. Recomendaciones para seleccionar un
repositorio existente
3. Ampliación repositorios institucionales
4. Creación de un repositorio FAIR consorciado
5. Ampliación para la gestión de todo el ciclo de
vida de los datos
Tamaño y
complejidad
Núm.. de proyectos
51. Aproximación asimétrica a RDM
1. Planes de gestión de datos (DMP)
2. Recomendaciones para seleccionar un
repositorio existente
3. Ampliación repositorios institucionales
4. Creación de un repositorio FAIR consorciado
5. Ampliación para la gestión de todo el ciclo de
vida de los datos
Tamaño y
complejidad
Núm.. de proyectos
52. Aproximación asimétrica a RDM
1. Planes de gestión de datos (DMP)
2. Recomendaciones para seleccionar un
repositorio existente
3. Ampliación repositorios institucionales
4. Creación de un repositorio FAIR consorciado
5. Ampliación para la gestión de todo el ciclo de
vida de los datos
Tamaño y
complejidad
Núm.. de proyectos
53. Aproximación asimétrica a RDM
1. Planes de gestión de datos (DMP)
2. Recomendaciones para seleccionar un
repositorio existente
3. Ampliación repositorios institucionales
4. Creación de un repositorio FAIR consorciado
5. Ampliación para la gestión de todo el ciclo de
vida de los datos
Tamaño y
complejidad
Núm.. de proyectos
54. Requisitos Factibles, Alcanzables e
Implementables para un Repositorio FAIR
• Inputs
– Análisis de referentes de otros países
– Estudio de informes técnicos
– 25 entrevistas con expertos
• Outputs
– 25 requisitos mínimos
– 4 buenas prácticas
– 3 recomendaciones
http://hdl.handle.net/2072/356460
55. Requisitos funcionales mínimos y factibles
1. Identificadores persistentes
2. Capacidad de almacenaje alta
3. Prestaciones medio-altas de preservación
4. Interoperabilidad con otros sistemas
5. Gestión de características especiales
56. Requisitos funcionales mínimos y factibles
1. Identificadores persistentes
– Asignar el DOI como identificador
– Soporte de ORCID
2. Capacidad de almacenaje alta
3. Prestaciones medio-altas de preservación
4. Interoperabilidad con otros sistemas
5. Gestión de características especiales
57. Requisitos funcionales mínimos y factibles
1. Identificadores persistentes
2. Capacidad de almacenaje alta
– Ficheros de hasta 10 GB por defecto
– Espacio elástico para crecimiento
3. Prestaciones medio-altas de preservación
4. Interoperabilidad con otros sistemas
5. Gestión de características especiales
58. Requisitos funcionales mínimos y factibles
1. Identificadores persistentes
2. Capacidad de almacenaje alta
3. Prestaciones medio-altas de preservación
– Disponibilidad del fichero un mínimo de 10 años
– Dos copias geográficamente distribuidas como mínimo
– Comprobar la integridad de los datos periódicamente
– Seguir el modelo de preservación OAIS
4. Interoperabilidad con otros sistemas
5. Gestión de características especiales
59. Requisitos funcionales mínimos y factibles
1. Identificadores persistentes
2. Capacidad de almacenaje alta
3. Prestaciones medio-altas de preservación
4. Interoperabilidad con otros sistemas
– Repositorios (institucionales, temáticos…)
– Almacenamiento en la nube (Unidisc, Dropbox…)
– Discovery tools (EOSC, PRC, OpenAire…)
– Protocolos comunicación estándar (OAI-PMH, API…)
– Formatos estándar de datos (XML, JSON)
5. Gestión de características especiales
60. Requisitos funcionales mínimos y factibles
1. Identificadores persistentes
2. Capacidad de almacenaje alta
3. Prestaciones medio-altas de preservación
4. Interoperabilidad con otros sistemas
5. Gestión de características especiales
– Diferentes versiones de un dataset
– Gestión de diferentes esquemas de metadatos
– Diferentes tipos de accesos
61. Requisitos funcionales mínimos y factibles
– Aceptación de cualquier tipo de formato
– Diferentes tipos de submit
– Citación recomendada
– Difusión de datasets a través de redes sociales
– Gestión de distintos tipos de licencias
– Datos analíticos de uso de la plataforma
– Suministrar metadatos para su reutilización
– Fácilmente usable
– Cumplimiento de la legislación vigente
62. Buenas prácticas
1. Realizar una curación de los datos
2. Seleccionar los conjuntos de datos
3. Fomentar el uso de formatos abiertos
4. Usar estándares i protocolos i vocabularios
controlados ampliamente aceptados
63. Resumen de otros países
País Liderazgo Infraestructura Estadio
Bélgica flamenca
VLIR (órgano consultivo
representante de 5
universidades)
• Elaborada una propuesta En estudio
Finlandia
Finnish Ministry of
Education and Culture y
producción de l’CSC-IT
• Centralizada
• Servei segons el cicle de vida de les dades:
• Descobrir (Etsin)
• Almacenar (IDA)
• Describir (Qvain)
• Preservar (Fairdata-PAS)
Inicial
Países Bajos DANS
• Centralizada
• Servei segons el cicle de vida de les dades:
• Descubrir (NARCIS)
• Publicar i gestionar (DataverseNL)
• Preservar (EASY)
Consolidado
Portugal
Fundação para a Ciência
e a Tecnologia
• Elaborada una propuesta pero paralizada por
falta de financiación
En estudio
Suecia
Swedish Research
Council y consorcio de 7
universidades y centros
de investigación
• Híbrida (repositori central SND + repositorios
institucionales)
• Servicio de preservación en desarrollo
Consolidado
64. Work in progress
• Se está desarrollando en el marco del CSUC y
con software libre existente un repositorio
cooperativo de datos de investigación que
gradualmente adopte los requisitos
presentados
• El diseño de esta infraestructura ha de
considerarse no definitivo y en evolución ya
que ha de tener características aún no
definidas (como la compatibilidad con EOSC)
66. 399 Departaments, Instituts i Àrees
Departaments i Àrees vigents
Instituts universitaris de recerca propis i vigents
539.430
Publicacions
Articles
Llibres
35.882
Projectes de recerca
Competitius
21 Universitats i
Centres de recerca
1.552 Grups de recerca
Grups de recerca SGR
Grups de recerca propis i vigents
30.725
Tesis
Dirigides
Escrites
11.879 Investigadors
PDI i PSR actius amb ORCID i
1 activitat
Finalidad: visualizar y difundir desde un único
lugar la actividad investigadora hecha en Cataluña
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78. Control de calidad, validación y
unificación de duplicados
Estandard europeo para
el intercambio de
información científica
Contend Research
Information
Systems (CRIS)
DRAC
GREC
Universitas XXI
iMarina
SIGMA
Excel
BBDD Propia
Altres
sistemes
d’informació
Contend Research
Information
Systems (CRIS)
Contend Research
Information
Systems (CRIS)
Contend Research
Information
Systems (CRIS)
https://github.com/CSUC/PRC-CSV2XML
Información complementaria (APIs)
‐ Citaciones (Scopus, WoS, Google Scholar)
‐ Enlaces open acess (Unpaywall)
‐ Altmetricas (Altmetrics)
‐ Portadas (Google Books)
‐ Estadísticas
80. Índice
• El CSUC y la ciencia abierta
• Los servicios y proyectos
– Repositorios institucionales y temáticos
– Repositorios de publicaciones periódicas
– Repositorios de datos y DMPs
– Ciencia abierta y datos abiertos
• 5 características comunes de los proyectos
• Referencias
86. Control de calidad, validación y
unificación de duplicados
Estandard europeo para
el intercambio de
información científica
Contend Research
Information
Systems (CRIS)
DRAC
GREC
Universitas XXI
iMarina
SIGMA
Excel
BBDD Propia
Altres
sistemes
d’informació
Contend Research
Information
Systems (CRIS)
Contend Research
Information
Systems (CRIS)
Contend Research
Information
Systems (CRIS)
Información complementaria (APIs)
‐ Citaciones (Scopus, WoS, Google Scholar)
‐ Enlaces open acess (Unpaywall)
‐ Altmetricas (Altmetrics)
‐ Portadas (Google Books)
‐ Estadísticas
Interoperatividad
Aprovechar el trabajo existente
No centralidad, ecosistema
Integraciones
102. Índice
• El CSUC y la ciencia abierta
• Los servicios y proyectos
– Repositorios institucionales y temáticos
– Repositorios de publicaciones periódicas
– Repositorios de datos y DMPs
– Ciencia abierta y datos abiertos
• 5 características comunes de los proyectos
• Referencias
103. Referencias
• Tesis Doctorales en Red (TDX): www.tdx.cat
• Repositorio de la investigación de Cataluña: www.recercat.cat
• Revistas Catalanas en Acceso Abierto (RACO): www.raco.cat
• Patrimonio Digital de Cataluña (PADICAT): www.padicat.cat
• Revistas Esp. de Ciencia y Tecnología: http://recyt.fecyt.es
• Memoria Digital de Cataluña (MDC): http://mdc.cbuc.cat
• Materiales Docentes en Red (MDX): www.mdx.cat
• Repositorio del Dept. Cultura: http://calaix.gencat.cat
• Repositorio de la Filmoteca: http://repositori.filmoteca.cat