SlideShare a Scribd company logo
1 of 95
Projekt Obálkyknih.cz
Jiří Nechvátal
Jihočeská vědecká knihovna v Českých Budějovicích
https://www.obalkyknih.cz
info@obalkyknih.cz
O projektu obalkyknih.cz
www.obalkyknih.cz
Historie projektu
2008 … vznik díky projektu Moravské zemské knihovny v rámci
programu VISK3 za spolupráce s Vědeckou knihovnou v
Olomouci
2011 ... projekt spravuje Městská knihovna v Praze
2013 …převod licence k software „databáze Obálkyknih.cz“ na
SDRUK
2013 … Jihočeská vědecká knihovna byla pověřena dalším
rozvojem projektu …
O projektu obalkyknih.cz
Agreguje různé zdroje informací o dokumentech a poskytuje je knihovním a jiným systémům :
 Obálky knih a periodik (uložit obálku je však možno i u speciálních dokumentů – map, hudebnin,
CD, DVD aj.)
 Obsahy knih a periodik (naskenované obsahy zpřístupněné v podobě PDF souborů)
 Seznam použité literatury (seznamu literatury u odborných publikací ve formě obrázku titulní
stránky, PDF všech skenovaných stránek včetně OCR vrstvy)
 Plné texty obsahů (převedené obsahy na text pomocí technologie OCR a zpřístupněné pro
indexaci knihovním systémem)
 Anotace (autorské, nakladatelské, ale i uživatelské popisy dokumentů pro snadnější výběr
čtenáři)
 Komentáře a hodnocení (možnost stažení dostupných komentářů a zároveň i možnost exportu
komentářů z jiných systémů na Obálkyknih.cz a tím zpřístupnění ostatním knihovnám)
 Autority (obrazové a jiné materiály napojené na ID autority, např. fotografie osob, GPS
souřadnice míst, www odkazy aj.)
 Citace (citace podle normy ISO 690 generované z ověřených zdrojů či generované z vlastních dat
knihoven)
 E-knihy (odkazy na volně přístupné e-knihy)
 Doporučování literatury (linky na další literaturu na základě podobnosti titulů a na základě
historie výpůjček čtenářů s podobnými zájmy)
 URL na digitalizované dokumenty (kramérius)
 Fotografie poboček knihoven
To všechno v podobě jedné snadno použitelné služby.
O projektu obalkyknih.cz
databáze aktuálně obsahuje (14.11.2022)
2 626 666 obálek ( u 2 252 139 dokumentů)
119 709 počet čísel periodik
786 634 obsahů
14 967 seznamů doporučené literatury
658 830 anotací
266 764 hodnocených titulů (13 374 323 hodnocení)
8 551 komentářů
60 663 fotografií autorit (867 864 autorit)
894 655 vygenerovaných citací
3 500 volných e-knih
493 323 odkazů na plné dokumenty (282 487 unikátních)
Historie počtu dostupných obálek
03. 06. 2011 497.000
15. 09. 2011 601.986
12. 12. 2012 731.880
17. 11. 2013 766.195
29. 10. 2014 902.217
29.09. 2015 1.000.000
19.09. 2016 1.260.000
07.10. 2017 1.539.111
22.10. 2018 1.816.123
22.11.2019 2.053.571
11.05.2021 2.323.956
14.11.2022 2.626.666
O projektu obalkyknih.cz
O projektu obalkyknih.cz
hlavní servery jsou provozovány v Jihočeské vědecké knihovně v Českých
Budějovicích, záložní server je v Moravské zemské knihovně v Brně
---------
v případě výpadku jednoho ze serverů mají knihovní systémy možnost přejít během
několika vteřin na záložní stroj bez ztráty dostupnosti služeb pro své čtenáře
---------
měsíčně hlavní server odbaví průměrně 55 miliónů požadavků, cca. 2 milióny denně,
průměrně 20 dotazů za vteřinu
---------
ve špičkách (9-15:00) odbavují servery 40-80 požadavků za vteřinu
---------
denně do databáze je nově nahráno nebo upraveno průměrně 600 dokumentů
---------
denní přírůstek dat činí 6 GB, z nich se následně generují náhledy obálek v různých
rozlišeních, PDF dokumenty s obsahy a rozpoznává se text pomocí OCR
---------
20 Mbit za vteřinu je datový tok ven ze serveru a na server což představuje cca. 95%
všech dat, které projdou internetovým připojením JVK
.
O projektu obalkyknih.cz
13 10
7
2 2 4 5
13
26
39 40
44 42 44
38
35
29
26
16 15 13 12
9 7
0
5
10
15
20
25
30
35
40
45
50
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
počet
přístupů
za
vteřinu
hodiny
Statistika přístupů na server
Přesun serveru obálkyknih.cz
z MZK do JVK
29.9.2014 od 22:00 do 00:00
cca. 1 TB dat
JVK převzala projekt kompletně do své správy
Technické řešení
CBVK
MZK
CBVK
INTERNET
O projektu obalkyknih.cz
Technické řešení
Volně dostupné kódy: https://github.com/cbvk/obalkyknih/wiki
Technické řešení
Dotaz na identifikátor:
ISBN
ISSN
ISMN
EAN
číslo ČNB
OCLC
UUID
vlastní identifikátor
http://cache.obalkyknih.cz/api/books?multi=[{“isbn”:”22978-80-267-0458-4”}]&sigla=CBA001&pretty=1
Technické řešení
CBVK
MZK
CBVK
Fotografie autorů
Obálky
Vyhledávání v obsazích
Odkazy na dig. dokumenty
Hodnocení
Seznam literatury
Obsahy
Anotace
Citace
Komentáře
Doporučování
E-knihy z MLP
Co nabízí projekt
Obálky monografií
Obsahy monografií
Obálky periodik
Obálky periodik
Obsahy a seznamy
literatury
Obálky periodik a vícesvazkových děl
Souborný
záznam
Ročník 2017, číslo 7
Zvláštní číslo
Svázaný ročník
Anotace
Hodnocení a
komentáře
Weby o knihách
Citace
Doporučování
Odkazy na e-knihy
Odkazy na e-knihy
Odkazy na digitalizované
dokumenty
Díla nedostupná na trhu
Díla nedostupná na trhu
Fotografie autorit
Fotografie autorit
Fotografie autorit
Regionální
osobnosti
Jihočeského
kraje
Fulltextové
prohledávání obsahů
Fulltextové
prohledávání obsahů
Obrázky knihoven
Failover
 zajišťuje dostupnost služby obalkyknih.cz
 je řešen aplikačně - aplikace kontroluje dostupnost primárního
serveru a v případě jeho výpadku přepne stahování ze záložního
serveru
API volání:
http://cache1.obalkyknih.cz/api/runtime/alive … JVK
http://cache2.obalkyknih.cz/api/runtime/alive … MZK
 v případě dostupnosti vrátí odpověď ALIVE
 v případě jiné odpovědi, nebo v případě nezodpovězení do 10 s lze
považovat primární server za nedostupný a je potřeba kontaktovat
záložní server (po 1 hodině testuje znovu)
... nic …
Duplicity záznamů
Synchronizace čísel ČNB
Opravy identifikátorů v AKS
„Soutěže“ knihoven ve
skenování na OKCZ
!!! Problémy v katalozích !!!
Zdroje dat,
spolupráce
Projekt čerpá data z několika zdrojů:
 stahování obálek dokumentů od nakladatelů: prvotní zdroj obálek, který byl realizován na základě
dohody sdružení SKIP s největšími nakladateli v ČR. Nakladatelé se mohou sami zaregistrovat na
stránkách projektu a zpřístupnit svá data. V současnosti tímto způsobem získáváme cca 15 %
obálek.
 přispívání spolupracujícími knihovnami: projekt provozuje více jak dva roky vlastní program, tzv.
skenovací klient (http://www.obalkyknih.cz/obalkyknih-scanner/). V současnosti se jedná o hlavní
zdroj dat, který poskytuje cca 60 % obálek a obsahů. JVK skenuje všechny nově nakoupené
dokumenty a postupně na server ukládáme i starší fond. Stejně tak postupuje několik dalších
knihoven v ČR.
 webové rozhraní projektu: na adrese http://www.obalkyknih.cz/upload mohou individuální
přispěvatelé zaslat obálky svých dokumentů. Rozhraní nepodporuje posílání obsahů.
 spolupracující webové portály. Importy dat přes veřejné nebo individuální XML exporty.
Spolupracujeme s portály: zbozi.cz, srovname,cz, ereading.cz, flexibook.cz, cbdb.cz, ....
 „sklízení“ rozličných zdrojů dat: individuální importy z jiných systémů.
Zdroje dat
Sklizeň dat z jiných systémů
Jak se zapojit do
projektu
obálkyknih.cz ?
Skenovací klient
Skenovací klient
Skenovací klient
Statistiky skenování
http://servis.obalkyknih.cz/stat/
Vkládání obálek přes web
Vkládání anotací
Vkládání anotací
Vkládání fotografií autorit
Vkládání fotografií autorit
Skenování
periodik
obálky, obsahy
Skenování periodik - obálky, obsahy
Skenování periodik - obálky, obsahy
Skenování periodik - obálky, obsahy
1060 periodik se skenuje celkem/77 500 stran
200 - Severočeská vědecká knihovna v Ústí nad Labem
175 - Jihočeská vědecká knihovna v Českých Budějovicích
154 - Národní knihovna ČR
95 - Knihovna Ústavního soudu
94 - Právnická fakulta – Masarykova univerzita
92 – Krajská knihovna Karlovy Vary
44 - Krajská vědecká knihovna Liberec
39 - Moravskoslezská vědecká knihovna v Ostravě
35 - Univerzita Palackého v Olomouci
26 - Moravská zemská knihovna
24 - Studijní a vědecká knihovna v Hradci Králové
11 - Univerzita Tomáše Bati ve Zlíně
6 - Pedagogická fakulta – Masarykova univerzita
4 - Univerzitní centrum Telč – Masarykova univerzita
4 - Teologická fakulta Jihočeské univerzity
3 - Archeologický ústav AV ČR
3 - Moravská galerie
2 - Přírodovědecká fakulta – Masarykova univerzita
2 - JABOK - Vyšší odborná škola sociálně ped. a teol.
Kontroly dat - https://servis.obalkyknih.cz/
Kontroly dat - https://servis.obalkyknih.cz/
Kontroly dat
Kontroly dat
Kontroly dat - https://servis.obalkyknih.cz/
Kontroly dat
Při kontrolách záznamů provadíme:
doplňování chybějících identifikátorů (číslo cnb, oclc, isbn)
doplňování popisných metadat pro zobrazování na stránkách projektu (název, autor, rok
vydání)
doplňování či úpravě anotace
výběru nejkvalitnější obálky (rozlišení, bez nálepek, …)
opravy chybných záznamů
propojení se záznamy (dílové tituly).
Kontroly dat - https://servis.obalkyknih.cz/
Kontroly dat - https://servis.obalkyknih.cz/
Kontroly dat - https://servis.obalkyknih.cz/
Rozhraní pro kontrolu
Rozhraní pro kontrolu
Podpora pro knihovny
Individuální projekty pro konkrétní knihovny:
… specifické výstupy, importy speciálních fondů, …
Knihovny Masarykovy univerzity
Národní památkový ústav
Masarykův ústav a Archiv AV ČR
NIPOS – Národní informační a poradenské středisko pro kulturu
Obalkyknih.cz
Obalkyknih.cz
Projekt - servisní sekce
https://servis.obalkyknih.cz/
Pomožme si sami …
Každá knihovna může přispět …
naskenovat obálky a obsahy svých dokumentů
a uložit je na obalkyknih.cz
!!! Výsledky práce využijí všichni !!!
Dotazy
Stránky projektu a informace
http://www.obalkyknih.cz
https://github.com/cbvk/obalkyknih/wiki
info@obalkyknih.cz
Projekt Obálkyknih.cz
Jiří Nechvátal
Jihočeská vědecká knihovna v Českých Budějovicích
https://www.obalkyknih.cz
info@obalkyknih.cz
zajímavost na závěr …
Po dobu prezentace server poskytl
…
cca. 225 000
obálek, obsahů, …
Děkuji za pozornost

More Related Content

Similar to Jiří Nechvátal: Projekt Obálkyknih.cz

Elektronické publikování a vědecká komunikace
Elektronické publikování a vědecká komunikaceElektronické publikování a vědecká komunikace
Elektronické publikování a vědecká komunikacelindask
 
Záležitosti elektronického publikování a současné metody vědecké komunikace
Záležitosti elektronického publikování a současné metody vědecké komunikaceZáležitosti elektronického publikování a současné metody vědecké komunikace
Záležitosti elektronického publikování a současné metody vědecké komunikacelindask
 
Ceska digitalni knihovna
Ceska digitalni knihovnaCeska digitalni knihovna
Ceska digitalni knihovnamartinlhotak
 
Záležitosti elektronického publikování a současné metody vědecké komunikace
Záležitosti elektronického publikování a současné metody vědecké komunikaceZáležitosti elektronického publikování a současné metody vědecké komunikace
Záležitosti elektronického publikování a současné metody vědecké komunikacelindask
 
Petr Žabička - Centrální portál knihovnen a knihovní systémy
Petr Žabička - Centrální portál knihovnen a knihovní systémyPetr Žabička - Centrální portál knihovnen a knihovní systémy
Petr Žabička - Centrální portál knihovnen a knihovní systémyMoravskaZemskaKnihovna
 
Elektronické informační zdroje a služby univerzitní knihovny pro podporu stud...
Elektronické informační zdroje a služby univerzitní knihovny pro podporu stud...Elektronické informační zdroje a služby univerzitní knihovny pro podporu stud...
Elektronické informační zdroje a služby univerzitní knihovny pro podporu stud...Národní technická knihovna (NTK)
 
Záležitosti elektronického publikování a současné metody vědecké komunikace
Záležitosti elektronického publikování a současné metody vědecké komunikaceZáležitosti elektronického publikování a současné metody vědecké komunikace
Záležitosti elektronického publikování a současné metody vědecké komunikacelindask
 
Digitalizace národního kulturního dědictví
Digitalizace národního kulturního dědictvíDigitalizace národního kulturního dědictví
Digitalizace národního kulturního dědictvíMichala Brožová
 
Adam Kretschmer: Stav automatizovanych evidenci v pametovych institucich v CR...
Adam Kretschmer: Stav automatizovanych evidenci v pametovych institucich v CR...Adam Kretschmer: Stav automatizovanych evidenci v pametovych institucich v CR...
Adam Kretschmer: Stav automatizovanych evidenci v pametovych institucich v CR...KISK FF MU
 
Rešeršní služby v NK ČR (Mgr. Karolína Košťálová, NK ČR)
 Rešeršní služby v NK ČR (Mgr. Karolína Košťálová, NK ČR)  Rešeršní služby v NK ČR (Mgr. Karolína Košťálová, NK ČR)
Rešeršní služby v NK ČR (Mgr. Karolína Košťálová, NK ČR) Národní technická knihovna (NTK)
 
Clanky.knihovna.cz
Clanky.knihovna.czClanky.knihovna.cz
Clanky.knihovna.czKISK FF MU
 
Online katalogy a weby knihoven
Online katalogy a weby knihovenOnline katalogy a weby knihoven
Online katalogy a weby knihovenJanKanka
 
TTT IVIG
TTT IVIGTTT IVIG
TTT IVIGJanMat
 
Otevřené publikování: jak se zorientovat ve světě open access
Otevřené publikování: jak se zorientovat ve světě open accessOtevřené publikování: jak se zorientovat ve světě open access
Otevřené publikování: jak se zorientovat ve světě open accessŠárka Grofová
 
Digitalizace a dlouhodobá ochrana digitálních dokumentů
Digitalizace a dlouhodobá ochrana digitálních dokumentůDigitalizace a dlouhodobá ochrana digitálních dokumentů
Digitalizace a dlouhodobá ochrana digitálních dokumentůMoravskaZemskaKnihovna
 

Similar to Jiří Nechvátal: Projekt Obálkyknih.cz (20)

Digitalni knihovna AV ČR
Digitalni knihovna AV ČRDigitalni knihovna AV ČR
Digitalni knihovna AV ČR
 
Elektronické publikování a vědecká komunikace
Elektronické publikování a vědecká komunikaceElektronické publikování a vědecká komunikace
Elektronické publikování a vědecká komunikace
 
Záležitosti elektronického publikování a současné metody vědecké komunikace
Záležitosti elektronického publikování a současné metody vědecké komunikaceZáležitosti elektronického publikování a současné metody vědecké komunikace
Záležitosti elektronického publikování a současné metody vědecké komunikace
 
Ceska digitalni knihovna
Ceska digitalni knihovnaCeska digitalni knihovna
Ceska digitalni knihovna
 
Informační zdroje pro anglistiku
Informační zdroje pro anglistikuInformační zdroje pro anglistiku
Informační zdroje pro anglistiku
 
Záležitosti elektronického publikování a současné metody vědecké komunikace
Záležitosti elektronického publikování a současné metody vědecké komunikaceZáležitosti elektronického publikování a současné metody vědecké komunikace
Záležitosti elektronického publikování a současné metody vědecké komunikace
 
Slezska digitalni knihovna
Slezska digitalni knihovnaSlezska digitalni knihovna
Slezska digitalni knihovna
 
Petr Žabička - Centrální portál knihovnen a knihovní systémy
Petr Žabička - Centrální portál knihovnen a knihovní systémyPetr Žabička - Centrální portál knihovnen a knihovní systémy
Petr Žabička - Centrální portál knihovnen a knihovní systémy
 
Elektronické informační zdroje a služby univerzitní knihovny pro podporu stud...
Elektronické informační zdroje a služby univerzitní knihovny pro podporu stud...Elektronické informační zdroje a služby univerzitní knihovny pro podporu stud...
Elektronické informační zdroje a služby univerzitní knihovny pro podporu stud...
 
Centrální portál knihoven
Centrální portál knihovenCentrální portál knihoven
Centrální portál knihoven
 
Záležitosti elektronického publikování a současné metody vědecké komunikace
Záležitosti elektronického publikování a současné metody vědecké komunikaceZáležitosti elektronického publikování a současné metody vědecké komunikace
Záležitosti elektronického publikování a současné metody vědecké komunikace
 
Digitalizace národního kulturního dědictví
Digitalizace národního kulturního dědictvíDigitalizace národního kulturního dědictví
Digitalizace národního kulturního dědictví
 
Adam Kretschmer: Stav automatizovanych evidenci v pametovych institucich v CR...
Adam Kretschmer: Stav automatizovanych evidenci v pametovych institucich v CR...Adam Kretschmer: Stav automatizovanych evidenci v pametovych institucich v CR...
Adam Kretschmer: Stav automatizovanych evidenci v pametovych institucich v CR...
 
07_infozdroje_ICT
07_infozdroje_ICT07_infozdroje_ICT
07_infozdroje_ICT
 
Rešeršní služby v NK ČR (Mgr. Karolína Košťálová, NK ČR)
 Rešeršní služby v NK ČR (Mgr. Karolína Košťálová, NK ČR)  Rešeršní služby v NK ČR (Mgr. Karolína Košťálová, NK ČR)
Rešeršní služby v NK ČR (Mgr. Karolína Košťálová, NK ČR)
 
Clanky.knihovna.cz
Clanky.knihovna.czClanky.knihovna.cz
Clanky.knihovna.cz
 
Online katalogy a weby knihoven
Online katalogy a weby knihovenOnline katalogy a weby knihoven
Online katalogy a weby knihoven
 
TTT IVIG
TTT IVIGTTT IVIG
TTT IVIG
 
Otevřené publikování: jak se zorientovat ve světě open access
Otevřené publikování: jak se zorientovat ve světě open accessOtevřené publikování: jak se zorientovat ve světě open access
Otevřené publikování: jak se zorientovat ve světě open access
 
Digitalizace a dlouhodobá ochrana digitálních dokumentů
Digitalizace a dlouhodobá ochrana digitálních dokumentůDigitalizace a dlouhodobá ochrana digitálních dokumentů
Digitalizace a dlouhodobá ochrana digitálních dokumentů
 

More from ÚISK FF UK

Martina Košanová: Komunikace s problémovými uživateli knihoven
Martina Košanová: Komunikace s problémovými uživateli knihovenMartina Košanová: Komunikace s problémovými uživateli knihoven
Martina Košanová: Komunikace s problémovými uživateli knihovenÚISK FF UK
 
Vojtěch Vojtíšek & Laďka Zbiejczuk Suchá: Redesign knihovních služeb: webové ...
Vojtěch Vojtíšek & Laďka Zbiejczuk Suchá: Redesign knihovních služeb: webové ...Vojtěch Vojtíšek & Laďka Zbiejczuk Suchá: Redesign knihovních služeb: webové ...
Vojtěch Vojtíšek & Laďka Zbiejczuk Suchá: Redesign knihovních služeb: webové ...ÚISK FF UK
 
Eva Novotná: Kartografické dědictví v Mapové sbírce Přírodovědecké fakulty UK
Eva Novotná: Kartografické dědictví v Mapové sbírce Přírodovědecké fakulty UKEva Novotná: Kartografické dědictví v Mapové sbírce Přírodovědecké fakulty UK
Eva Novotná: Kartografické dědictví v Mapové sbírce Přírodovědecké fakulty UKÚISK FF UK
 
Iva Horová: Sto let pokusů o vybudování národního zvukového archivu
Iva Horová: Sto let pokusů o vybudování národního zvukového archivuIva Horová: Sto let pokusů o vybudování národního zvukového archivu
Iva Horová: Sto let pokusů o vybudování národního zvukového archivuÚISK FF UK
 
Andrea Jelínková: Knihovědní detektivové
Andrea Jelínková: Knihovědní detektivovéAndrea Jelínková: Knihovědní detektivové
Andrea Jelínková: Knihovědní detektivovéÚISK FF UK
 
Martina Košanová: Vizuální smog v knihovnách
Martina Košanová: Vizuální smog v knihovnáchMartina Košanová: Vizuální smog v knihovnách
Martina Košanová: Vizuální smog v knihovnáchÚISK FF UK
 
Jana Šeblová: Samizdatová literatura a hudební publicistika
Jana Šeblová: Samizdatová literatura a hudební publicistikaJana Šeblová: Samizdatová literatura a hudební publicistika
Jana Šeblová: Samizdatová literatura a hudební publicistikaÚISK FF UK
 
Marie Balíková: Databáze věcných autorit
Marie Balíková: Databáze věcných autoritMarie Balíková: Databáze věcných autorit
Marie Balíková: Databáze věcných autoritÚISK FF UK
 
Eva Lesenková: Zdravotní gramotnost : Jak můžeme lépe získat informace o zdraví?
Eva Lesenková: Zdravotní gramotnost : Jak můžeme lépe získat informace o zdraví?Eva Lesenková: Zdravotní gramotnost : Jak můžeme lépe získat informace o zdraví?
Eva Lesenková: Zdravotní gramotnost : Jak můžeme lépe získat informace o zdraví?ÚISK FF UK
 
Anna Hoťová: Školní knihovny
Anna Hoťová: Školní knihovnyAnna Hoťová: Školní knihovny
Anna Hoťová: Školní knihovnyÚISK FF UK
 
Magdalena Paul: Fake news
Magdalena Paul: Fake newsMagdalena Paul: Fake news
Magdalena Paul: Fake newsÚISK FF UK
 
Rudolf Rosa: Milníky umělé inteligence
Rudolf Rosa: Milníky umělé inteligenceRudolf Rosa: Milníky umělé inteligence
Rudolf Rosa: Milníky umělé inteligenceÚISK FF UK
 
Pavel Berounský: Prohlídka datacentra Kokura (18. 10. 2021)
Pavel Berounský: Prohlídka datacentra Kokura (18. 10. 2021) Pavel Berounský: Prohlídka datacentra Kokura (18. 10. 2021)
Pavel Berounský: Prohlídka datacentra Kokura (18. 10. 2021) ÚISK FF UK
 
Pavel Herout: Datová centra (18. 10. 2021)
Pavel Herout: Datová centra (18. 10. 2021)Pavel Herout: Datová centra (18. 10. 2021)
Pavel Herout: Datová centra (18. 10. 2021)ÚISK FF UK
 
Anna Štičková: Čuchni ke knize
Anna Štičková: Čuchni ke knizeAnna Štičková: Čuchni ke knize
Anna Štičková: Čuchni ke knizeÚISK FF UK
 
Hana Šandová: Centrum technického vzdělávání Půda jako třetí oddělení knihovny
Hana Šandová: Centrum technického vzdělávání Půda jako třetí oddělení knihovnyHana Šandová: Centrum technického vzdělávání Půda jako třetí oddělení knihovny
Hana Šandová: Centrum technického vzdělávání Půda jako třetí oddělení knihovnyÚISK FF UK
 
Open data (Civic Tech)
Open data (Civic Tech) Open data (Civic Tech)
Open data (Civic Tech) ÚISK FF UK
 
Vojtěch Ripka: Taking Mediality Seriously
Vojtěch Ripka: Taking Mediality SeriouslyVojtěch Ripka: Taking Mediality Seriously
Vojtěch Ripka: Taking Mediality SeriouslyÚISK FF UK
 
Tereza Simandlová: Open science v prostředí akademických knihoven: nová výzva...
Tereza Simandlová: Open science v prostředí akademických knihoven: nová výzva...Tereza Simandlová: Open science v prostředí akademických knihoven: nová výzva...
Tereza Simandlová: Open science v prostředí akademických knihoven: nová výzva...ÚISK FF UK
 

More from ÚISK FF UK (20)

Martina Košanová: Komunikace s problémovými uživateli knihoven
Martina Košanová: Komunikace s problémovými uživateli knihovenMartina Košanová: Komunikace s problémovými uživateli knihoven
Martina Košanová: Komunikace s problémovými uživateli knihoven
 
Vojtěch Vojtíšek & Laďka Zbiejczuk Suchá: Redesign knihovních služeb: webové ...
Vojtěch Vojtíšek & Laďka Zbiejczuk Suchá: Redesign knihovních služeb: webové ...Vojtěch Vojtíšek & Laďka Zbiejczuk Suchá: Redesign knihovních služeb: webové ...
Vojtěch Vojtíšek & Laďka Zbiejczuk Suchá: Redesign knihovních služeb: webové ...
 
Eva Novotná: Kartografické dědictví v Mapové sbírce Přírodovědecké fakulty UK
Eva Novotná: Kartografické dědictví v Mapové sbírce Přírodovědecké fakulty UKEva Novotná: Kartografické dědictví v Mapové sbírce Přírodovědecké fakulty UK
Eva Novotná: Kartografické dědictví v Mapové sbírce Přírodovědecké fakulty UK
 
Iva Horová: Sto let pokusů o vybudování národního zvukového archivu
Iva Horová: Sto let pokusů o vybudování národního zvukového archivuIva Horová: Sto let pokusů o vybudování národního zvukového archivu
Iva Horová: Sto let pokusů o vybudování národního zvukového archivu
 
Andrea Jelínková: Knihovědní detektivové
Andrea Jelínková: Knihovědní detektivovéAndrea Jelínková: Knihovědní detektivové
Andrea Jelínková: Knihovědní detektivové
 
Martina Košanová: Vizuální smog v knihovnách
Martina Košanová: Vizuální smog v knihovnáchMartina Košanová: Vizuální smog v knihovnách
Martina Košanová: Vizuální smog v knihovnách
 
Jana Šeblová: Samizdatová literatura a hudební publicistika
Jana Šeblová: Samizdatová literatura a hudební publicistikaJana Šeblová: Samizdatová literatura a hudební publicistika
Jana Šeblová: Samizdatová literatura a hudební publicistika
 
Jak na video?
Jak na video? Jak na video?
Jak na video?
 
Marie Balíková: Databáze věcných autorit
Marie Balíková: Databáze věcných autoritMarie Balíková: Databáze věcných autorit
Marie Balíková: Databáze věcných autorit
 
Eva Lesenková: Zdravotní gramotnost : Jak můžeme lépe získat informace o zdraví?
Eva Lesenková: Zdravotní gramotnost : Jak můžeme lépe získat informace o zdraví?Eva Lesenková: Zdravotní gramotnost : Jak můžeme lépe získat informace o zdraví?
Eva Lesenková: Zdravotní gramotnost : Jak můžeme lépe získat informace o zdraví?
 
Anna Hoťová: Školní knihovny
Anna Hoťová: Školní knihovnyAnna Hoťová: Školní knihovny
Anna Hoťová: Školní knihovny
 
Magdalena Paul: Fake news
Magdalena Paul: Fake newsMagdalena Paul: Fake news
Magdalena Paul: Fake news
 
Rudolf Rosa: Milníky umělé inteligence
Rudolf Rosa: Milníky umělé inteligenceRudolf Rosa: Milníky umělé inteligence
Rudolf Rosa: Milníky umělé inteligence
 
Pavel Berounský: Prohlídka datacentra Kokura (18. 10. 2021)
Pavel Berounský: Prohlídka datacentra Kokura (18. 10. 2021) Pavel Berounský: Prohlídka datacentra Kokura (18. 10. 2021)
Pavel Berounský: Prohlídka datacentra Kokura (18. 10. 2021)
 
Pavel Herout: Datová centra (18. 10. 2021)
Pavel Herout: Datová centra (18. 10. 2021)Pavel Herout: Datová centra (18. 10. 2021)
Pavel Herout: Datová centra (18. 10. 2021)
 
Anna Štičková: Čuchni ke knize
Anna Štičková: Čuchni ke knizeAnna Štičková: Čuchni ke knize
Anna Štičková: Čuchni ke knize
 
Hana Šandová: Centrum technického vzdělávání Půda jako třetí oddělení knihovny
Hana Šandová: Centrum technického vzdělávání Půda jako třetí oddělení knihovnyHana Šandová: Centrum technického vzdělávání Půda jako třetí oddělení knihovny
Hana Šandová: Centrum technického vzdělávání Půda jako třetí oddělení knihovny
 
Open data (Civic Tech)
Open data (Civic Tech) Open data (Civic Tech)
Open data (Civic Tech)
 
Vojtěch Ripka: Taking Mediality Seriously
Vojtěch Ripka: Taking Mediality SeriouslyVojtěch Ripka: Taking Mediality Seriously
Vojtěch Ripka: Taking Mediality Seriously
 
Tereza Simandlová: Open science v prostředí akademických knihoven: nová výzva...
Tereza Simandlová: Open science v prostředí akademických knihoven: nová výzva...Tereza Simandlová: Open science v prostředí akademických knihoven: nová výzva...
Tereza Simandlová: Open science v prostředí akademických knihoven: nová výzva...
 

Jiří Nechvátal: Projekt Obálkyknih.cz

  • 1. Projekt Obálkyknih.cz Jiří Nechvátal Jihočeská vědecká knihovna v Českých Budějovicích https://www.obalkyknih.cz info@obalkyknih.cz
  • 3.
  • 4. Historie projektu 2008 … vznik díky projektu Moravské zemské knihovny v rámci programu VISK3 za spolupráce s Vědeckou knihovnou v Olomouci 2011 ... projekt spravuje Městská knihovna v Praze 2013 …převod licence k software „databáze Obálkyknih.cz“ na SDRUK 2013 … Jihočeská vědecká knihovna byla pověřena dalším rozvojem projektu …
  • 5. O projektu obalkyknih.cz Agreguje různé zdroje informací o dokumentech a poskytuje je knihovním a jiným systémům :  Obálky knih a periodik (uložit obálku je však možno i u speciálních dokumentů – map, hudebnin, CD, DVD aj.)  Obsahy knih a periodik (naskenované obsahy zpřístupněné v podobě PDF souborů)  Seznam použité literatury (seznamu literatury u odborných publikací ve formě obrázku titulní stránky, PDF všech skenovaných stránek včetně OCR vrstvy)  Plné texty obsahů (převedené obsahy na text pomocí technologie OCR a zpřístupněné pro indexaci knihovním systémem)  Anotace (autorské, nakladatelské, ale i uživatelské popisy dokumentů pro snadnější výběr čtenáři)  Komentáře a hodnocení (možnost stažení dostupných komentářů a zároveň i možnost exportu komentářů z jiných systémů na Obálkyknih.cz a tím zpřístupnění ostatním knihovnám)  Autority (obrazové a jiné materiály napojené na ID autority, např. fotografie osob, GPS souřadnice míst, www odkazy aj.)  Citace (citace podle normy ISO 690 generované z ověřených zdrojů či generované z vlastních dat knihoven)  E-knihy (odkazy na volně přístupné e-knihy)  Doporučování literatury (linky na další literaturu na základě podobnosti titulů a na základě historie výpůjček čtenářů s podobnými zájmy)  URL na digitalizované dokumenty (kramérius)  Fotografie poboček knihoven To všechno v podobě jedné snadno použitelné služby.
  • 6. O projektu obalkyknih.cz databáze aktuálně obsahuje (14.11.2022) 2 626 666 obálek ( u 2 252 139 dokumentů) 119 709 počet čísel periodik 786 634 obsahů 14 967 seznamů doporučené literatury 658 830 anotací 266 764 hodnocených titulů (13 374 323 hodnocení) 8 551 komentářů 60 663 fotografií autorit (867 864 autorit) 894 655 vygenerovaných citací 3 500 volných e-knih 493 323 odkazů na plné dokumenty (282 487 unikátních)
  • 7. Historie počtu dostupných obálek 03. 06. 2011 497.000 15. 09. 2011 601.986 12. 12. 2012 731.880 17. 11. 2013 766.195 29. 10. 2014 902.217 29.09. 2015 1.000.000 19.09. 2016 1.260.000 07.10. 2017 1.539.111 22.10. 2018 1.816.123 22.11.2019 2.053.571 11.05.2021 2.323.956 14.11.2022 2.626.666 O projektu obalkyknih.cz
  • 8. O projektu obalkyknih.cz hlavní servery jsou provozovány v Jihočeské vědecké knihovně v Českých Budějovicích, záložní server je v Moravské zemské knihovně v Brně --------- v případě výpadku jednoho ze serverů mají knihovní systémy možnost přejít během několika vteřin na záložní stroj bez ztráty dostupnosti služeb pro své čtenáře --------- měsíčně hlavní server odbaví průměrně 55 miliónů požadavků, cca. 2 milióny denně, průměrně 20 dotazů za vteřinu --------- ve špičkách (9-15:00) odbavují servery 40-80 požadavků za vteřinu --------- denně do databáze je nově nahráno nebo upraveno průměrně 600 dokumentů --------- denní přírůstek dat činí 6 GB, z nich se následně generují náhledy obálek v různých rozlišeních, PDF dokumenty s obsahy a rozpoznává se text pomocí OCR --------- 20 Mbit za vteřinu je datový tok ven ze serveru a na server což představuje cca. 95% všech dat, které projdou internetovým připojením JVK .
  • 9. O projektu obalkyknih.cz 13 10 7 2 2 4 5 13 26 39 40 44 42 44 38 35 29 26 16 15 13 12 9 7 0 5 10 15 20 25 30 35 40 45 50 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 počet přístupů za vteřinu hodiny Statistika přístupů na server
  • 10. Přesun serveru obálkyknih.cz z MZK do JVK 29.9.2014 od 22:00 do 00:00 cca. 1 TB dat JVK převzala projekt kompletně do své správy
  • 12. Technické řešení Volně dostupné kódy: https://github.com/cbvk/obalkyknih/wiki
  • 13. Technické řešení Dotaz na identifikátor: ISBN ISSN ISMN EAN číslo ČNB OCLC UUID vlastní identifikátor http://cache.obalkyknih.cz/api/books?multi=[{“isbn”:”22978-80-267-0458-4”}]&sigla=CBA001&pretty=1
  • 15.
  • 16. Fotografie autorů Obálky Vyhledávání v obsazích Odkazy na dig. dokumenty Hodnocení Seznam literatury Obsahy Anotace Citace Komentáře Doporučování E-knihy z MLP Co nabízí projekt
  • 22. Obálky periodik a vícesvazkových děl
  • 43. Failover  zajišťuje dostupnost služby obalkyknih.cz  je řešen aplikačně - aplikace kontroluje dostupnost primárního serveru a v případě jeho výpadku přepne stahování ze záložního serveru API volání: http://cache1.obalkyknih.cz/api/runtime/alive … JVK http://cache2.obalkyknih.cz/api/runtime/alive … MZK  v případě dostupnosti vrátí odpověď ALIVE  v případě jiné odpovědi, nebo v případě nezodpovězení do 10 s lze považovat primární server za nedostupný a je potřeba kontaktovat záložní server (po 1 hodině testuje znovu)
  • 44.
  • 46.
  • 47.
  • 48.
  • 49.
  • 50.
  • 51.
  • 52.
  • 53. Duplicity záznamů Synchronizace čísel ČNB Opravy identifikátorů v AKS „Soutěže“ knihoven ve skenování na OKCZ !!! Problémy v katalozích !!!
  • 55. Projekt čerpá data z několika zdrojů:  stahování obálek dokumentů od nakladatelů: prvotní zdroj obálek, který byl realizován na základě dohody sdružení SKIP s největšími nakladateli v ČR. Nakladatelé se mohou sami zaregistrovat na stránkách projektu a zpřístupnit svá data. V současnosti tímto způsobem získáváme cca 15 % obálek.  přispívání spolupracujícími knihovnami: projekt provozuje více jak dva roky vlastní program, tzv. skenovací klient (http://www.obalkyknih.cz/obalkyknih-scanner/). V současnosti se jedná o hlavní zdroj dat, který poskytuje cca 60 % obálek a obsahů. JVK skenuje všechny nově nakoupené dokumenty a postupně na server ukládáme i starší fond. Stejně tak postupuje několik dalších knihoven v ČR.  webové rozhraní projektu: na adrese http://www.obalkyknih.cz/upload mohou individuální přispěvatelé zaslat obálky svých dokumentů. Rozhraní nepodporuje posílání obsahů.  spolupracující webové portály. Importy dat přes veřejné nebo individuální XML exporty. Spolupracujeme s portály: zbozi.cz, srovname,cz, ereading.cz, flexibook.cz, cbdb.cz, ....  „sklízení“ rozličných zdrojů dat: individuální importy z jiných systémů. Zdroje dat
  • 56. Sklizeň dat z jiných systémů
  • 57. Jak se zapojit do projektu obálkyknih.cz ?
  • 62.
  • 63.
  • 70.
  • 71. Skenování periodik - obálky, obsahy
  • 72. Skenování periodik - obálky, obsahy
  • 73. Skenování periodik - obálky, obsahy 1060 periodik se skenuje celkem/77 500 stran 200 - Severočeská vědecká knihovna v Ústí nad Labem 175 - Jihočeská vědecká knihovna v Českých Budějovicích 154 - Národní knihovna ČR 95 - Knihovna Ústavního soudu 94 - Právnická fakulta – Masarykova univerzita 92 – Krajská knihovna Karlovy Vary 44 - Krajská vědecká knihovna Liberec 39 - Moravskoslezská vědecká knihovna v Ostravě 35 - Univerzita Palackého v Olomouci 26 - Moravská zemská knihovna 24 - Studijní a vědecká knihovna v Hradci Králové 11 - Univerzita Tomáše Bati ve Zlíně 6 - Pedagogická fakulta – Masarykova univerzita 4 - Univerzitní centrum Telč – Masarykova univerzita 4 - Teologická fakulta Jihočeské univerzity 3 - Archeologický ústav AV ČR 3 - Moravská galerie 2 - Přírodovědecká fakulta – Masarykova univerzita 2 - JABOK - Vyšší odborná škola sociálně ped. a teol.
  • 74. Kontroly dat - https://servis.obalkyknih.cz/ Kontroly dat - https://servis.obalkyknih.cz/
  • 77. Kontroly dat - https://servis.obalkyknih.cz/
  • 78. Kontroly dat Při kontrolách záznamů provadíme: doplňování chybějících identifikátorů (číslo cnb, oclc, isbn) doplňování popisných metadat pro zobrazování na stránkách projektu (název, autor, rok vydání) doplňování či úpravě anotace výběru nejkvalitnější obálky (rozlišení, bez nálepek, …) opravy chybných záznamů propojení se záznamy (dílové tituly).
  • 79. Kontroly dat - https://servis.obalkyknih.cz/
  • 80. Kontroly dat - https://servis.obalkyknih.cz/
  • 81. Kontroly dat - https://servis.obalkyknih.cz/
  • 84. Podpora pro knihovny Individuální projekty pro konkrétní knihovny: … specifické výstupy, importy speciálních fondů, … Knihovny Masarykovy univerzity Národní památkový ústav Masarykův ústav a Archiv AV ČR NIPOS – Národní informační a poradenské středisko pro kulturu
  • 87. Projekt - servisní sekce https://servis.obalkyknih.cz/
  • 88. Pomožme si sami … Každá knihovna může přispět … naskenovat obálky a obsahy svých dokumentů a uložit je na obalkyknih.cz !!! Výsledky práce využijí všichni !!!
  • 89.
  • 91. Stránky projektu a informace http://www.obalkyknih.cz https://github.com/cbvk/obalkyknih/wiki info@obalkyknih.cz
  • 92. Projekt Obálkyknih.cz Jiří Nechvátal Jihočeská vědecká knihovna v Českých Budějovicích https://www.obalkyknih.cz info@obalkyknih.cz
  • 94. Po dobu prezentace server poskytl … cca. 225 000 obálek, obsahů, …