Prezentacja z seminarium dla doktorantów "Publikuj i nie zgiń: jak publikować, aby być widocznym i wspierać swoją karierę?". Seminarium zostało zorganizowane w BUW 19 listopada 2015 r. przez Obywateli Nauki, Platformę Otwartej Nauki (ICM UW), Laboratorium Cyfrowe Humanistyki UW oraz BUW.
Open Data - zarządzanie danymi w projektach badawczych NCN
Publikuj i nie zgiń_lsu_mast
1. Publikuj i nie zgiń! Jak publikować, aby być
widocznym i wspierać swoją karierę?
Michał Starczewski
Lidia Stępińska-Ustasiak
Platforma Otwartej Nauki
ICM Uniwersytet Warszawski
2. Publikowanie w karierze naukowca
Punkty Ocena pracownikaWpływ
Zasięg
Parametry brane
pod uwagę we
wnioskach
grantowych
Indeks H
Widoczność Ocena jednostki
naukowej
Cytowania
3. Rynek wydawniczy
• 28 000 czasopism naukowych
• 1,5 miliona artykułów naukowych rocznie
• Tysiące wydawców naukowych na świecie
• Ponad 2000 polskich czasopism punktowanych na liście
MNiSW
7. Impact Factor 2014 IF =
𝐴
𝐵
A = Ile razy w 2014 r. zostały zacytowane artykuły
opublikowane w latach 2012-2013
B = Liczba wszystkich artykułów
opublikowanych w latach 2012-2013, które mogły zostać zacytowane
Liczone są wyłącznie artykuły indeksowane w bazie Web of Science
(11.809 periodyków)
Journal Citation Reports – coroczna publikacja
8.
9.
10.
11. Indeks H
• Zaproponowany w 2005 r. przez fizyka Jorge E. Hirscha
• h = liczba publikacji zacytowana minimum h razy
• Preferuje długie, równomierne kariery
• Naukowcy, którzy opublikowali niewiele
często cytowanych prac mają niski indeks H
• Brany pod uwagę m.in. przez NCN
12. Wykaz czasopism punktowanych MNiSW
• Część A – czasopisma z listy JCR (mają impact factor) => 15-50 pkt
• Część B – czasopisma, które złożyły ankietę ewaluacyjną => min. 1 pkt
• Część C – czasopisma z listy ERIH wg stanu na 31.08.2013
(European Reference Index for the Humanities) => min. 10 pkt
Ankieta czasopism: kryteria formalne
(stabilność wydawnicza, języki publikacji, dostępność w internecie, indeksowanie w
bazach, …)
16. Dlaczego zmienia się komunikacja w nauce?
Ograniczenia
tradycyjnego
systemu
dystrybucji
publikacji
naukowych
Rozwój nowych
technologii
Rosną koszty
subskrypcji
Potrzeba
szybszej, bardziej
efektywnej i
bardziej globalnej
wymiany wiedzy
Rozwój
otwartego
dostępu
17. Open Access
Rewolucja w dostępie
• Treści dostępne za darmo w publicznym internecie
• Bez ograniczeń finansowych, technicznych lub prawnych
• Z zachowaniem kontroli nad integralnością i uznaniem autorstwa
19. Otwarty dostęp do publikacji
Złota droga:
otwarte czasopisma i książki
Zielona droga:
otwarte repozytoria naukowe
20. Otwartość w nauce na świecie
Otwartość jest wdrażana przez najlepsze uczelnie, takie jak Harvard,
Princeton, MIT czy Politechnika Federalna w Zurychu, które uznają, że
ułatwia ona współpracę, promuje osiągnięcia naukowe i wzmacnia rolę
nauki w rozwoju gospodarczym.
Instytucje finansujące badania coraz częściej wymagają, aby efekty
finansowanych przez nie projektów były dostępne w sposób otwarty
(National Institutes of Health, Wellcome Trust, brytyjskie Research
Councils, węgierska OTKA, Komisja Europejska i ERC).
Rozwiązania dotyczące otwartości są też przyjmowane na szczeblu
rządowym, np. w USA, Argentynie, Hiszpanii.
21. Otwarty dostęp w Polsce w liczbach
• Prawie połowa (49%) spośród niemal 2000 czasopism punktowanych z
wykazu MNiSW udostępnia swoje bieżące numery bezpłatnie w internecie.
• Wzrasta popularność praktyk otwartościowych wśród badaczy: 59%
przebadanych naukowców przynajmniej raz udostępniło w sposób otwarty
swoją pracę, choć tylko niespełna 12% z nich robi to regularnie.
• 74% respondentów popiera udostępnianie w sposób otwarty wyników
wszystkich badań naukowych finansowanych ze środków publicznych.
• Powstają repozytoria instytucjonalne i dziedzinowe, w których naukowcy
mogą umieszczać swoje prace (artykuły, książki, rozprawy doktorskie czy
raporty) – jest ich obecnie, łącznie z repozytoriami danych badawczych 29.
44. Nie tylko prawo autorskie
• Ochrona baz danych
• Ochrona danych osobowych
• Patenty
• …
45. Prawo autorskie
• Prawa wyłączne („wszystkie prawa zastrzeżone”)
• Przedmiot ochrony: UTWÓR
(przejaw działalności twórczej o indywidualnym charakterze)
Ale NIE: idee, odkrycia, procedury, koncepcje matematyczne, …
46. Prawa autorskie
Osobiste
- więź twórcy z utworem
(autorstwo, integralność, decyzja
o udostępnieniu, …)
- nieograniczone w czasie
- niezbywalne
Majątkowe
- korzystanie z utworu na
różnych polach eksploatacji
- ograniczone w czasie
- zbywalne
53. Na jak wiele pozwolę odbiorcy?
Otwarty dostęp
GRATIS
Otwarty dostęp
LIBRE
54.
55.
56. Creative Commons
w nauce
• Autorskie prawa majątkowe mogą blokować rozpowszechnianie
publikacji
• Licencje CC zapewniają ochronę praw osobistych (m.in. autorstwo)
• Walutą naukowców są cytowania i prestiż
• Text & data mining
60. Co jest przedmiotem otwartego dostępu?
Artykuły i książki
KTHBiblioteket,CC-BY-SA
https://www.flickr.com/photos/kthbiblioteket/4472640423/
Dane badawcze
„zarejestrowane materiały o charakterze faktograficznym powszechnie
uznawane przez społeczność naukową za niezbędne do oceny wyników
badań naukowych”
61. Definicje danych badawczych
„Zarejestrowane materiały o charakterze faktograficznym powszechnie uznawane
przez społeczność naukową za niezbędne do oceny wyników badań naukowych.”
„Do danych badawczych zaliczamy wszystko, co zostało
wyprodukowane lub wytworzone w ramach prowadzonych badań.”
„Dane badawcze to dane zebrane, zaobserwowane lub wytworzone jako
materiał do analizy, w celu uzyskania oryginalnych wyników naukowych.”
62. Dokumenty tekstowe, notatki laboratoryjne
Dane liczbowe
Kwestionariusze, ankiety, wyniki badań ankietowych
Nagrania audio i video, zdjęcia
Próbki, artefakty, obiekty
Zawartość baz danych (video, audio, teksty, obrazy)
Modele matematyczne, algorytmy
Oprogramowanie (skrypty, pliki wejściowe…)
Wyniki symulacji komputerowych
Protokoły laboratoryjne, opisy metodologiczne
Co zaliczamy do danych badawczych?
63. 1. Można się dowiedzieć, że istnieją
2. Można je obejrzeć
3. Można z nich korzystać
Co to znaczy, że dane są otwarte?
64. 5 gwiazdek dla otwartych danych
Tim Berners-Lee, 5-star Open Data, 5stardata.info
1. Dane są dostępne na otwartej licencji
2. Struktura danych jest dostępna
3. Otwarty format danych
4. Zastosowanie URI do identyfikacji danych
5. Powiązanie danych z innymi danymi w
sieci (linked data) (kontekst)
69. Po co otwierać dane badawcze?
łatwiej sprawdzić, czy opublikowane już prace naukowe opierają się na powtarzalnych
wynikach, łatwiej także przeciwdziałać oszustwom i nierzetelności naukowej
udostępnienie danych umożliwia nowe analizy i interpretacje
otwarte dane można łączyć ze sobą, tworząc nowe zestawienia
z otwartych danych mogą korzystać naukowcy z innych dziedzin oraz osoby spoza
środowiska akademickiego, co daje szanse na ich nowatorskie wykorzystanie
dzięki otwartym danym badania naukowe posuwają się szybciej, jest mniej konkurencji,
a więcej współpracy
70. Po co umieszczać dane badawcze w
repozytorium?
bezpieczna archiwizacja
dane są opisane i udokumentowane – łatwiej z nich skorzystać w przyszłości
łatwość wyszukiwania przez wszystkich zainteresowanych
dane mają stały URL i/lub identyfikator – mogą być jednoznacznie cytowane w
pracach naukowych
71. Otwarte dane – repozytoria specjalistyczne
Berman,Kleywegt,Nakamura,Markley(2012)
http://dx.doi.org/10.1016/j.str.2012.01.010
Protein Data Bank
– od 1971 roku
Oxford Text Archive
– od 1976 roku
GenBank
– od 1982 roku
http://www.ncbi.nlm.nih.gov/genb
ank/statistics
72. Co z danymi, dla których brakuje
specjalistycznych repozytoriów?
➞ Szeroko zakrojone lub ogólne repozytoria danych
➞ Czasopisma publikujące dane (data journals)
73. ogólne (publikacje + dane)
Repozytorium krajowe (Holandia; dane)
Nauki biologiczne (dane powiązane z publikacjami)
ogólne (publikacje + dane)
Uczelniane (dane i linki do danych)
Repozytoria danych
Repozytorium krajowe (Polska; dane)
74. Dane:
(1) badawcze
(2) otwarte
RepOD - serwis dla polskiej społeczności
akademickiej
➞ ze wszystkich dziedzin nauki
➞ wszystkie formaty plików
www.repod.pon.pl
76. Metadane
• Tytuł, autor(autorzy), rok wydania, krótki opis…
• Link do powiązanej publikacji naukowej
• Informacje o finansowaniu badań
• Licencja prawna
78. Prawny status udostępnionych danych
• bez licencji: dozwolony użytek
• uwolnienie do domeny publicznej (np. Creative Commons Zero)
• otwarte licencje (np. Creative Commons)
79. Ograniczenia prawne w otwieraniu danych
• Ochrona prywatności osób (anonimizacja danych)
• Dane związane z bezpieczeństwem i obronnością
• Ochrona gatunków zagrożonych, ochrona stanowisk archeologicznych…
• Ochrona interesów komercyjnych gdy badania były prowadzone we współpracy
z partnerem komercyjnym
81. Plan zarządzania danymi
(DMP; data management plan)
1. Jakie dane zostaną wytworzone lub zebrane?
(co będą zawierać? jakie będą formaty plików? jak dużo będzie danych?)
2. Jak zostaną uporządkowane i opisane?
3. Kwestie etyczne i prawne
(kwestie związane z ochroną prywatności, dane niejawne, etc.)
4. W jaki sposób dane zostaną udostępnione?
(jak, kiedy, komu)
5. Które dane będą przechowywane długoterminowo? Gdzie, jak długo?
83. Jak szukać danych w repozytoriach?
w repozytoriach
specjalistycznych
zwykłe wyszukiwarki
internetowe
Rejestr repozytoriów
84. Dodatkowe źródła informacji
● „Otwarty dostęp” Peter Suber
● Poradnik omawiający
problematykę praw autorskich:
"Otwarty dostęp do publikacji
naukowych. Kwestie prawne„
● Raport „Otwarta nauka w Polsce
2014. Diagnoza”
1. U.S. Office of Management and Budget (1999)
2. Newcastle University, UK
3. Boston University, US
NIE zaliczamy: wstępne analizy, brudnopisy tekstów naukowych, plany przyszłych badań, recenzje w ramach peer review, dyskusje z innymi badaczami
ISTOTNE: przedmiotem otwartego dostępu są te dane, które posiadamy w postaci cyfrowej, więc np. znalezisko archeologiczne jest zaliczane do danych badawczych, ale przedmiotem otwartego dostępu może być co najwyżej zdjęcie tego obiektu lub jego skan 3D.
Dotyczy wszystkich danych – głównie z myślą o danych publicznych.
Tim Berners-Lee: przewodniczący Konsorcjum W3C.
Dane publiczne – ze źródeł rządowych i z administracji publicznej.
Cultural: Data about cultural works and artefacts — for example titles and authors — and generally collected and held by galleries, libraries, archives and museums.
Science: Data that is produced as part of scientific research from astronomy to zoology.
Finance: Data such as government accounts (expenditure and revenue) and information on financial markets (stocks, shares, bonds etc).
Statistics: Data produced by statistical offices such as the census and key socioeconomic indicators.
Weather: The many types of information used to understand and predict the weather and climate.
Environment: Information related to the natural environment such presence and level of pollutants, the quality and rivers and seas.
Transport: Data such as timetables, routes, on-time statistics.
Repozytoria rządowe w innych krajach:
data.gov
data.gov.uk
publicdata.eu
open-data.europa.eu
Liczne inicjatywy istniejące nawet od kilkudziesięciu lat – głównie repozytoria danych, np. GenBank (1982 w obecnej formie; NCBI – część biblioteki NIH), Protein Data Bank (od 1971; wtedy Brookhaven Nat. Lab i Cambridge Univ.).
Od 1989: virtually every journal requires deposition of coordinates and experimental data as a prerequisite to publication (PDB).
Od 198???: czasopisma wymagają, by sekwencje DNA były deponowane.
Inne: PaleoBioDB (1998), dla archeologii, dla nauk społecznych, dla modeli matematycznychw biologii, etc.
Repozytoria danych: bez formalnej recenzji, choć w specjalistycznych repozytoriach są zwykle kuratorzy
Czasopisma publikujące dane (data journals) to nie jest alternatywa, raczej osobne zjawisko: i tak dane w repozytorium – albo jako Supplementary Files. 1. formalne recenzowanie; 2. wiele osób uważa, że danych nie należy recenzować; 3. nowe – nie wiadomo, czy się rozpowszechni.
W projektach generujących Big Data problem jest często przemyślany i rozwiązany w jakiś sposób (bo dane od początku są postrzegane jako główny wytwór, celem całego projektu może być wygenerowanie pewnych danych i udostępnienie ich środowisku do analizy).
Udostępnianie danych:
repozytorium specjalistyczne (dla danego typu danych z danej dziedziny)
szerokie repozytorium tematyczne, dziedzinowe
repozytorium instytucjonalne
repozytorium ogólne: krajowe, europejskie, ogólnodostępne
Dane badawcze – repod jest moderowany, tzn. każdy zbiór danych jest po zdeponowaniu akceptowany przez kogoś z zespołu i dopiero wtedy jest widoczny dla pozostałych użytkowników.
Pojedynczy plik – max 10 GB.
Pliki: różne formaty w jednym zbiorze.
Liczba wejść / liczba pobrań dla każdego pliku (także wejścia dla zbioru danych).
OpenAIRE: zarejestrujemy się zapewne przed końcem roku.
DOI: cytowanie w publikacjach naukowych!
Pliki, a nie linki.
Każdy plik może być na innej licencji.
Zarządzanie danymi badawczymi ma miejsce w każdym projekcie naukowym, który generuje jakiekolwiek dane.
Natomiast możemy powiedzieć, że dane badawcze są dobrze zarządzane wtedy, gdy na początku projektu badacz postawi sobie kilka pytań dotyczących zarządzania danymi. Kluczowe jest to, aby było to na początku projektu!
Dane udostępnimy z łatwością tylko wtedy, gdy są właściwie zarządzane – w przeciwnym razie będzie nas to kosztować sporo pracy, a może też okazać się niemożliwe. ZDM jest punktem wyjścia dla udostępniania danych.
Tak prowadzone zarządzanie danymi badawczymi pozwoli nam bez dodatkowych wysiłków udostępnić dane, a także korzystać z nich w przyszłości.
Zwykłe wyszukiwarki internetowe: znajdą też repozytoria, których nie ma w re3data.org; znajdą bezpośrednio dane po słowach kluczowych (ze wszystkich repozytoriów).
Szukamy: w specjalistycznym; w dziedzinowym; w instytucjonalnym wtedy, gdy szukamy wyników konkretnego badacza lub zespołu – w pozostałych sytuacjach przez Google’a.