Este documento discute a gestão de dados científicos em instituições. Apresenta uma agenda com tópicos como planos de intervenção, ciclo de vida dos dados, planos de gestão de dados e repositórios. Também fornece recomendações como compreender como a instituição lida com dados, providenciar serviços de armazenamento e tornar os dados mais acessíveis. O objetivo é apoiar investigadores no manejo de dados ao longo de sua vida útil e promover a reutilização e compartilhamento de dados científicos
2. AGENDA
1. Planos de intervenção e estratégias na gestão dos dados
científicos;
2. Ciclo de vida dos dados científicos e as etapas na gestão dos
dados (referência a serviços e ferramentas);
3. Planos de Gestão de Dados;
4. Repositórios de Dados;
5. Recursos para treinamento de profissionais de informação e
investigadores.
4. 6 regras para as Universidades
1. Compreender como a instituição lida com dados científicos.
2. Conceber um caso para Gestão de Dados e reunir apoios.
3. Definir o posicionamento da sua instituição sobre a GDC
para instituir uma política e estratégia.
4. Assegurar que os investigadores estão conscientes sobre os
dados que existem disponíveis.
5. Providenciar serviços robustos de armazenamento de dados
e fáceis de utilizar.
6. Tornar mais fácil aos outros encontrarem e citarem dados
de investigação.
4
5. PROCESSOS E ÁREAS DE AÇÃO NAS INSTITUIÇÕES
CICLO DE VIDA DA
INVESTIGAÇÃO
DMPs, dados existentes,
documentação, metadados,
datasets, depositar, partilhar
INFRAESTRUTURA
Arquivos de dados,
repositórios, acesso,
licenças, preservação, cloud,
DOI
GOVERNAÇÃO
Financiadores,
Universidades, Instituições
de Investigação, Políticas,
Protocolos
6. Quem está envolvido na instituição?
Bibliotecas
Serviços de
TIC
Gabinetes
de
investigação
7. Áreas de envolvimento das Bibliotecas
Serviços de
Suporte
Infraestrutura e
normalização
Políticas e
prática por
disciplinas
Competências e
recursos
humanos
8. Ligue des Bibliothèques Européennes de Recherche
Association of European Research Libraries
League of European Research Universities
10. Ten recommendations for libraries to get started with
research data management :
1. Offer research data management support, including data management plans for
grant applications, intellectual property rights ad-vice and information materials.
Assist facul-ty with data management plans and the in-tegration of data
management into the cur-riculum.
2. Engage in the development of metadata and data standards and provide metadata
services for research data.
3. Create Data Librarian posts and develop professional staff skills for data librarian-
ship.
4. Actively participate in institutional research data policy development, including re-
source plans. Encourage and adopt open data policies where appropriate in the re-
search data life cycle.
5. Liaise and partner with researchers, re-search groups, data archives and data cen-
ters to foster an interoperable infrastruc-ture for data access, discovery and data
sharing.
10
11. Ten recommendations for libraries to get started with
research data management :
6. Support the lifecycle for research data by providing services for storage, discovery
and permanent access.
7. Promote research data citation by applying persistent identifiers to research data.
8. Provide an institutional Data Catalogue or Data Repository, depending on
available in-frastructure.
9. Get involved in subject specific data man-agement practice.
10. Offer or mediate secure storage for dynam-ic and static research data in co-
operation with institutional IT units and/or seek ex-ploitation of appropriate
cloud services.
11
12. 10 Recommendations for libraries to get
started with research data management
Regrouping the recommendations – Areas of engagement
Support services
#1 Offer research data management support, including data management plans for grant applications, intellectual
property rights advice and information materials. Assist faculty with data management plans and the integration of
data management into the curriculum.
#6 Support the lifecycle for research data by providing services for storage, discovery and permanent access.
Infrastructure & standards
#2 Engage in the development of metadata and data standards and provide metadata services for research data.
#5 Liaise and partner with researchers, research groups, data archives and data centers to foster an
interoperable infrastructure for data access, discovery and data sharing.
#7 Promote research data citation by applying persistent identifiers to research data.
#8 Provide an institutional Data Catalogue or Data Repository, depending on available infrastructure.
#10 Offer or mediate secure storage for dynamic and static research data in co-operation with institutional IT
units and/or seek exploitation of appropriate cloud services.
Policy & disciplinary practices
#4 Actively participate in institutional research data policy development, including resource plans. Encourage
and adopt open data policies where appropriate in the research data life cycle.
#7 ... (with some disciplinary views on data citation)
Skills & staffing
#3 Create Data Librarian posts and develop professional staff skills for data librarianship.
#1 … and the integration of data management into the curriculum.
12
13. Recomendações da LIBER revisitadas
Serviços de suporte
#1 #6
Infraestrutura & normalização
#2 #5 #7 #8 #10
Políticas & prática por disciplinas
#4 #7
Competências & recursos humanos
#3 #1
Gestão de Dados Científicos @ Seminário BAD, 16 de setembro de 2014 13
14. 1. Apoio na gestão dos dados científicos
• Offer research data management support, including data
management plans for grant applications, intellectual property
rights advice and information materials. Assist faculty with data
management plans and the integration of data management
into the curriculum.
14
17. 2. Desenvolvimento de normas e serviços de
metadados
• Engage in the development of metadata and data standards
and provide metadata services for research data.
17
21. 3. Desenvolvimento de competências
• Create Data Librarian posts and develop professional staff skills
for data librarianship.
21
22.
23. 4. Políticas institucionais de gestão dos dados
• Actively participate in institutional research data policy
development, including resource plans. Encourage and adopt
open data policies where appropriate in the research data life
cycle.
23
25. 5. Trabalhar em articulação com os parceiros
para fomentar infraestruturas
• Liaise and partner with researchers, research groups,
data archives and data centers to foster an
interoperable infrastructure for data access, discovery
and data sharing.
25
26. Quem está envolvido na instituição?
Bibliotecas
Serviços de
TIC
Gabinetes
de
investigação
27. 6. Disponibilizar serviços de curadoria no ciclo de vida
dos dados científicos
• Support the lifecycle for research data by providing
services for storage, discovery and permanent access.
27
29. 7. Citação dos dados e links e identificadores
permanentes
• Promote research data citation by applying persistent
identifiers to research data.
29
31. 8. Repositórios de dados
• Provide an institutional Data Catalogue or Data Repository,
depending on available infrastructure.
Gestão de Dados Científicos @ Seminário BAD, 16 de setembro de 2014 31
32. 9. Envolva-se e pratique a gestão de dados científicos
• Get involved in subject specific data management
practice.
32
35. 10. Oferecer ou mediar serviços de armazenamento
• Offer or mediate secure storage for dynamic and static
research data in co-operation with institutional IT units
and/or seek exploitation of appropriate cloud services.
Gestão de Dados Científicos @ Seminário BAD, 16 de setembro de 2014 35
36. PROCESSOS E ÁREAS DE AÇÃO NAS INSTITUIÇÕES
Planeamento
da gestão de
dados
Gestão de
active data
Seleção de
dados e
utilização
Repositórios
de dados
Catálogos de
dadosINFRAESTRUTURA
Arquivos de dados,
repositórios, acesso,
licenças, preservação,
cloud, DOI
Política e estratégia de
GDC
Planos de negócio e
sustentabilidade
.
suporte
.
guias
.
formação
39. UniversidadedoMinho Serviços de Documentação
A gestão de dados científicos tem assumindo
crescente relevância no contexto das
instituições.
reforçar a sua capacidade de gestão e curadoria dos
seus recursos para apoiarem as necessidades de
dados dos investigadores.
Requisitos dos financiadores de ciência:
Comissão Europeia (CE) criou recentemente, no âmbito do
programa quadro Horizonte 2020, um projeto-piloto de dados
abertos.
A FCT em Portugal adotou no contexto da sua política de Acesso
Aberto, orientações sobre a disponibilização de dados de
projetos com seu financiamento.
Enquadramento: motivação e necessidade
40. PLANO DE
INTERVENÇÃO
• Elaborado em janeiro de 2014
• Apresentado a toda a equipa dos
SDUM em março de 2014
• Resulta de um trabalho de análise
da equipa de projetos Open Access
• Define 10 eixos de intervenção
• 33 ações programadas para 2014 e
2015
41. 1. Análise da realidade da gestão dos dados científicos
produzidos na UMinho
Inclui observação de práticas de produção, planeamento e armazenamento de dados
científicos e estudo dos contextos institucionais dentro da UM.
2. Serviços de apoio e consultoria na gestão de dados
científicos
Inclui planos de gestão de dados para projetos financiados e desenvolvimento de materiais
informativos e guias formativos.
3. Especificação de um serviço interno dedicado para
dados científicos e desenvolvimento de competências
dos colaboradores SDUM
Focado essencialmente na formação interna da equipa dos SDUM tendo em vista a
melhoria das competências e definição de serviços à comunidade.
ConfOA 2015
42. 4. Desenvolvimento da política institucional para a
gestão de dados científicos
Participação ativa no desenvolvimento da política, incluindo a disseminação de boas práticas
e o incentivo à adoção de políticas de dados abertos no ciclo de vida dos dados de
investigação.
5. Promoção da interoperabilidade de infraestruturas de
dados científicos
Estabelecimento de parcerias com investigadores, grupos de investigação, repositórios e
arquivos e bases de dados para promover o acesso, utilização e partilha dos dados.
6. Serviços de curadoria para o ciclo de vida dos dados
científicos
Apoiar os investigadores e grupos de investigação no ciclo de vida dos dados científicos
(recolha, análise, armazenamento e publicação) providenciando serviços de armazenamento,
pesquisa e acesso.
ConfOA 2015
43. 7. Serviços de metadados para dados de investigação
Inclui o conhecimento e identificação de normas e esquemas de metadados e eventual
envolvimento no desenvolvimento de serviços de metadados para dados científicos.
8. Promoção da referenciação e citação dos dados
científicos
Promover a correta citação dos dados, clarificando regras a utilizar, melhorando a utilização
dos identificadores persistentes.
9. Serviço de repositório de dados científicos
Diligenciar no sentido de criar um repositório de dados e/ou disponibilizar ou sugerir
serviços de depósito de dados científicos.
10. Melhorar a prática da gestão dos dados científicos e a
disponibilização de dados aberto
Inclui o estabelecimento de metodologias internas para o planeamento da gestão de dados
científicos e para a disponibilização de dados em acesso aberto devidamente documentados.
ConfOA 2015
44. OBJ.3
Desenvolver um programa para
a criação de serviços de gestão
de dados científicos na UMinho
Ind. 3.1 Diagnóstico dos dados
científicos na Uminho
Ind. 3.2 Conteúdos/Serviços de
apoio e consultoria de gestão
dados científicos
Ind. 3.3 Gestão dos dados
produzidos/recolhidos nos
SDUM
45. Áreas estratégicas do plano de
intervenção 2014-2015 dos SDUM:
Diagnóstico & política
Serviços de suporte &
informação
Infraestruturas &
normalização
Competências &
recursos humanos
ConfOA 2014
47. UniversidadedoMinho Serviços de Documentação
Estrutura do inquérito
IDENTIFICAÇÃO
(CARACTERIZAÇÃO DOS
PARTICIPANTES)
CURADORIA E GESTÃO
DE DADOS CIENTÍFICOS
ACERVO DE DADOS
CIENTÍFICOS
EXISTENTES
49. Diagnóstico: 2) passo – comunidades piloto
Identificação, observação e descrição de 3 a 5 casos para estudo:
Trabalho baseado no DAF (Data Asset Framework) -
http://www.data-audit.eu
Questionários que identifica dados existentes e responsabilidades.
Com utilização adicional do CARDIO - http://cardio.dcc.ac.uk
Ferramenta para grupos de investigação avaliarem as suas capacidades de
gestão dos dados produzidos.
Preparar a informação das comunidades selecionadas de
acordo do guião DAF.
50. A ter em atenção…
Discutir barreiras e fragilidades.
Identificar os principais parceiros
para embarcar nesta aventura.
Considerar a cultura institucional
e o ambiente interno.
51. PROCESSOS E ÁREAS DE AÇÃO NAS INSTITUIÇÕES
Roadmaps, planos e estratégias de
intervenção.
Definição de requisitos técnicos e diagnósticos.
Desenvolvimento da política de dados científicos.
Implementação de formação, ferramentas e
serviços piloto.
Protocolos para utilização e partilha de recursos.
GOVERNAÇÃO
Financiadores,
Universidades,
Instituições de
Investigação, Políticas,
Protocolos
52. UniversidadedoMinho Serviços de Documentação
http://www.ed.ac.uk/polopoly_fs/1.116873!/fileManager/UoE-RDM-Roadmap-140106.pdf
53. Monash University's
Research Data Management Strategy and Strategic Plan 2012-2015
Gestão de Dados Científicos @ Seminário
BAD, 16 de setembro de 2014
53
54. Monash University's
Research Data Management Strategy and Strategic Plan 2012-2015
Gestão de Dados Científicos @ Seminário
BAD, 16 de setembro de 2014
54
55. VER ALGUNS EXEMPLOS DE POLÍTICAS
Observação
55
https://drive.google.com/folderview?id=0BylH9UFdHl4wRndLWEQxdVlfM2M&usp=sharing
56. Ciclo de vida dos dados científicos e as
etapas na gestão dos dados 56
2
57. GESTÃO DE DADOS CIENTÍFICOS
Gestão de dados científicos ou curadoria de dados é a
atividade de organização e utilização de dados desde o
momento da sua criação, com a finalidade de garantir o seu
armazenamento, a sua pesquisa e respetiva reutilização.
Na Gestão de Dados Científicos estão envolvidos vários
processos:
Planeamento de dados > Criação de dados > Documentação
dos dados > Acesso e utilização dos dados > Armazenamento
e backups > Partilha dos dados > Preservação dos dados.
58. A GESTÃO DE DADOS CIENTÍFICOS
ADEQUADA IRÁ:
1. Aumentar o
impacto da
investigação
2. Melhorar a
acessibilidade
3. Prevenir o uso
inadequado
4. Salvaguardar os
dados produzidos
5. Assegurar
compatibilidade
59. O que é que a GDC oferece às Bibliotecas…
Possibilidade:
De estabelecer credibilidade numa nova área de envolvimento.
De explorar e aprender novas competências técnicas.
Oportunidade:
De aproximação à comunidade de investigadores e seus
processos de investigação (relações de trabalho mais próximas).
De ‘sujar as mãos’ com dados não publicados ou dados em bruto
que são os blocos de construção do conhecimento.
60. Digital Curation Centre - UK
Um visão integrada:
Gestão de Dados Científicos @ Seminário
BAD, 16 de setembro de 2014
60
61. PROCESSOS E ÁREAS DE AÇÃO NAS INSTITUIÇÕES
CICLO DE VIDA DA
INVESTIGAÇÃO
DMPs, dados existentes,
documentação,
metadados, datasets,
depositar, partilhar
CollaborateConceber Design Experiment Publish DivulgarAnalyseProjetar ColaborarTestar PublicarAnalisar
DOCUMENTAÇÃOCRIAÇÃOPLANEAMENTO
PARTILHAARMAZENAMENTOACESSO
Plataformas para
armazenamento, descrição e
de gestão dados
Aplicações para
Planeamento
Repositórios e
Revistas científicas
62. PROCESSOS E ÁREAS DE AÇÃO NAS INSTITUIÇÕES
CICLO DE VIDA DA
INVESTIGAÇÃO
DMPs, dados existentes,
documentação,
metadados, datasets,
depositar, partilhar
CollaborateConceber Design Experiment Publish DivulgarAnalyseProjetar ColaborarTestar PublicarAnalisar
Plataformas para
armazenamento, descrição e
de gestão dados
Aplicações para
Planeamento
Repositórios e
Revistas científicas
63. Gestão de Dados Científicos
Um dos primeiros requisitos é que os conjuntos de dados
sejam acompanhados de informação que
descreva a sua origem (tempo ou espaço, métodos e
instrumentos de recolha), âmbito, autoria, propriedade e
condições de reutilização, ou seja, de metadados.
Em paralelo com a interoperabilidade tecnológica, a
existência de metadados adequados e normalizados é um
requisito essencial para o acesso e reutilização dos dados
científicos.
63
64. DOCUMENTAÇÃO E METADADOS
Repositórios de dados científicos e a normalização dos
metadados.
Difícil uniformizar a descrição entre domínios ceintíficos.
A descrição dos conjuntos de dados ainda se pode
considerar muito pouco desenvolvida.
Ao nível do conjunto têm sido adoptados modelos genéricos
como o do Dublin Core, já muito utilizado nos repositórios
institucionais.
Projecto DataShare (Edimburgo, Oxford e Southampton)
64
65. Necessidade dos metadados
Public
Research
Community
Project
Researcher
Metadata may not be required
if you are working alone on
your own computer, but
become crucial when data are
shared online.
Metadata help to place your
dataset in a broader context,
allowing those outside your
institution, discipline, or
research environment to
understand how to interpret
your data.
65
69. Projeto-piloto de Dados Abertos da CE
Linhas de orientação:
Projeto-piloto que visa melhorar e maximizar o
acesso e a reutilização dos dados de
investigação gerados por projetos.
Nos projeto participantes no piloto é requerido o deposito
de dados de investigação:
Outros dados, incluindo metadados associados,
necessários para validar os resultados apresentados em
publicações científicas, logo que possível;
dados associados, conforme especificado e dentro dos
prazos estabelecidos no plano de gestão de dados.
69
70. REQUISITOS NA PRÁTICA (simplificados)
Projeto-piloto de Dados Científicos Abertos
Criar um plano de gestão dos dados
Assegurar o depósito num repositório
Associar licenças CC
Providenciar ferramentas
O foco deve ser o planeamento >> para a disponibilização dos dados,
facilitando o depósito e a licença para permitir a reutilização.
71. Papel da biblioteca – na prática
71
National Science Foundation
http://youtu.be/Lc82pxxRkMo
75. A destacar
• Permitir que todos possam partilhar e citar os dados
• Recebe dados multidisciplinares de comunidade
científica, investigador e instituição.
• Proporciona um interface para ligar dados à informação
do projeto de financiamento.
• Qualquer dado ou coleção armazenada é passivel de
agragação vía OAI-PMH.
• Fácil de usar
75
87. Temas comuns da Formação GDC
nos programas de referências europeus
O que são dados?
Papéis de
responsabilidades
Políticas
Gestão de dados
Partilha de dados
DMPs
Ferramentas e
serviços
Armazenamento
Acesso
Questões éticas
Publicação
Preservação
Citação
Licenças
…
97. Course comparisons
RDMRose
Intro & roles
Policy & practice
Lifecycle & DMPs
Support landscape
(Open) data
RDM, repositories,
metadata &
citation
Case study & job
descriptions
Roles &
responsibilities.
Reflecton.
Essentials 4
data support
Definitions
Planning
Collecting,
describing &
storing data
Archive, publish,
cite data
Policy, practice,
licensing
Data support,
roles, case
studies
SupportDM
Intro to data
& RDM
Supporting
researchers
DMPs
What to keep
and why
Cataloguing
data
Data sharing
RDM Support
Intro to RDM
Data & services
DMPs
Data storage &
retention
Data description
Rules on
research data
Data sharing
and reuse
DIY Kit
Research data
explained
DMPs
Documentation
Storage &
security
Ethics &
copyright
Data sharing
Case study
Intros
Policy
DMPs
Description
Storage
Case studiesRoles
Legal issues
Archive & share
Support &
services
Sarah Jones @sjDCC slide http://www.dcc.ac.uk/sites/default/files/documents/events/workshops/Comparing-
notes/RDM-courses.pptx
98. Precisamos de
Adquirir confiança!
E compreender as diferentes questões
técnicas e estratégicas.
Adquirir Formação! Arriscar fazer.
98
Have a vote first for all recommendations – show the color which fits best for you
What is the main color of all votes (for each of the 10 recommendations)
Comissão Europeia (CE) criou recentemente, no âmbito do programa quadro Horizonte 2020, um projeto-piloto de dados abertos que visa melhorar e maximizar o acesso e a reutilização dos dados de investigação gerados por projetos financiados.
Na mesma linha, a Fundação para a Ciência e a Tecnologia (FCT) adotou, a 5 de maio de 2014, no quadro mais amplo da sua política de Acesso Aberto, orientações sobre a disponibilização de dados e outros resultados de projetos financiados pela FCT, que encorajam os investigadores a disponibilizarem os dados resultantes dos projetos de I&D Política sobre a disponibilização de dados e outros resultados de projetos de I&D financiados pela FCT.
Resulta de um trabalho de análise da equipa de projetos Open Access
Define 10 eixos de intervenção
Enquadrados em 4 áreas estratégicas
33 ações programadas para 2014 e 2015
More opportunities to show significance/relevance
Analyzing several training resources we find some common themes (institutional level or national or border level)
An Open Educational Resource on RDM tailored for information professionals
Provided by EDINA and Data Library, University of Edinburgh in association with the UK Data Archive, Digital Curation Centre (DCC), and Distributed Data Curation Center at the Purdue University Libraries.
Session 1: Data management planning
Session 2: Organising & documenting data
Session 3: Data storage & security
Session 4: Ethics & copyright
Session 5: Data sharing
Provided by EDINA and Data Library, University of Edinburgh in association with the UK Data Archive, Digital Curation Centre (DCC), and Distributed Data Curation Center at the Purdue University Libraries.
RDM Support is a basic training course in research data management (support) for information specialists. The training course was developed by Mariëtte van Selm for the information specialists of the Library of the University of Amsterdam (UvA), within the framework of the RDM Support project (2013-2015). The training course was held from January to April 2014.