Prezentace k přednášce v předmětu Odborné fórum ze dne 14. 11. 2022. Přednášky pořádá Ústav informačních studií a knihovnictví a Česká informační společnost: http://cisvts.cz/. Více informací o cyklu přednášek naleznete na: https://uisk.ff.cuni.cz/cs/pro-verejnost/odborne-forum/.
4. Historie projektu
2008 … vznik díky projektu Moravské zemské knihovny v rámci
programu VISK3 za spolupráce s Vědeckou knihovnou v
Olomouci
2011 ... projekt spravuje Městská knihovna v Praze
2013 …převod licence k software „databáze Obálkyknih.cz“ na
SDRUK
2013 … Jihočeská vědecká knihovna byla pověřena dalším
rozvojem projektu …
5. O projektu obalkyknih.cz
Agreguje různé zdroje informací o dokumentech a poskytuje je knihovním a jiným systémům :
Obálky knih a periodik (uložit obálku je však možno i u speciálních dokumentů – map, hudebnin,
CD, DVD aj.)
Obsahy knih a periodik (naskenované obsahy zpřístupněné v podobě PDF souborů)
Seznam použité literatury (seznamu literatury u odborných publikací ve formě obrázku titulní
stránky, PDF všech skenovaných stránek včetně OCR vrstvy)
Plné texty obsahů (převedené obsahy na text pomocí technologie OCR a zpřístupněné pro
indexaci knihovním systémem)
Anotace (autorské, nakladatelské, ale i uživatelské popisy dokumentů pro snadnější výběr
čtenáři)
Komentáře a hodnocení (možnost stažení dostupných komentářů a zároveň i možnost exportu
komentářů z jiných systémů na Obálkyknih.cz a tím zpřístupnění ostatním knihovnám)
Autority (obrazové a jiné materiály napojené na ID autority, např. fotografie osob, GPS
souřadnice míst, www odkazy aj.)
Citace (citace podle normy ISO 690 generované z ověřených zdrojů či generované z vlastních dat
knihoven)
E-knihy (odkazy na volně přístupné e-knihy)
Doporučování literatury (linky na další literaturu na základě podobnosti titulů a na základě
historie výpůjček čtenářů s podobnými zájmy)
URL na digitalizované dokumenty (kramérius)
Fotografie poboček knihoven
To všechno v podobě jedné snadno použitelné služby.
6. O projektu obalkyknih.cz
databáze aktuálně obsahuje (14.11.2022)
2 626 666 obálek ( u 2 252 139 dokumentů)
119 709 počet čísel periodik
786 634 obsahů
14 967 seznamů doporučené literatury
658 830 anotací
266 764 hodnocených titulů (13 374 323 hodnocení)
8 551 komentářů
60 663 fotografií autorit (867 864 autorit)
894 655 vygenerovaných citací
3 500 volných e-knih
493 323 odkazů na plné dokumenty (282 487 unikátních)
8. O projektu obalkyknih.cz
hlavní servery jsou provozovány v Jihočeské vědecké knihovně v Českých
Budějovicích, záložní server je v Moravské zemské knihovně v Brně
---------
v případě výpadku jednoho ze serverů mají knihovní systémy možnost přejít během
několika vteřin na záložní stroj bez ztráty dostupnosti služeb pro své čtenáře
---------
měsíčně hlavní server odbaví průměrně 55 miliónů požadavků, cca. 2 milióny denně,
průměrně 20 dotazů za vteřinu
---------
ve špičkách (9-15:00) odbavují servery 40-80 požadavků za vteřinu
---------
denně do databáze je nově nahráno nebo upraveno průměrně 600 dokumentů
---------
denní přírůstek dat činí 6 GB, z nich se následně generují náhledy obálek v různých
rozlišeních, PDF dokumenty s obsahy a rozpoznává se text pomocí OCR
---------
20 Mbit za vteřinu je datový tok ven ze serveru a na server což představuje cca. 95%
všech dat, které projdou internetovým připojením JVK
.
13. Technické řešení
Dotaz na identifikátor:
ISBN
ISSN
ISMN
EAN
číslo ČNB
OCLC
UUID
vlastní identifikátor
http://cache.obalkyknih.cz/api/books?multi=[{“isbn”:”22978-80-267-0458-4”}]&sigla=CBA001&pretty=1
16. Fotografie autorů
Obálky
Vyhledávání v obsazích
Odkazy na dig. dokumenty
Hodnocení
Seznam literatury
Obsahy
Anotace
Citace
Komentáře
Doporučování
E-knihy z MLP
Co nabízí projekt
43. Failover
zajišťuje dostupnost služby obalkyknih.cz
je řešen aplikačně - aplikace kontroluje dostupnost primárního
serveru a v případě jeho výpadku přepne stahování ze záložního
serveru
API volání:
http://cache1.obalkyknih.cz/api/runtime/alive … JVK
http://cache2.obalkyknih.cz/api/runtime/alive … MZK
v případě dostupnosti vrátí odpověď ALIVE
v případě jiné odpovědi, nebo v případě nezodpovězení do 10 s lze
považovat primární server za nedostupný a je potřeba kontaktovat
záložní server (po 1 hodině testuje znovu)
55. Projekt čerpá data z několika zdrojů:
stahování obálek dokumentů od nakladatelů: prvotní zdroj obálek, který byl realizován na základě
dohody sdružení SKIP s největšími nakladateli v ČR. Nakladatelé se mohou sami zaregistrovat na
stránkách projektu a zpřístupnit svá data. V současnosti tímto způsobem získáváme cca 15 %
obálek.
přispívání spolupracujícími knihovnami: projekt provozuje více jak dva roky vlastní program, tzv.
skenovací klient (http://www.obalkyknih.cz/obalkyknih-scanner/). V současnosti se jedná o hlavní
zdroj dat, který poskytuje cca 60 % obálek a obsahů. JVK skenuje všechny nově nakoupené
dokumenty a postupně na server ukládáme i starší fond. Stejně tak postupuje několik dalších
knihoven v ČR.
webové rozhraní projektu: na adrese http://www.obalkyknih.cz/upload mohou individuální
přispěvatelé zaslat obálky svých dokumentů. Rozhraní nepodporuje posílání obsahů.
spolupracující webové portály. Importy dat přes veřejné nebo individuální XML exporty.
Spolupracujeme s portály: zbozi.cz, srovname,cz, ereading.cz, flexibook.cz, cbdb.cz, ....
„sklízení“ rozličných zdrojů dat: individuální importy z jiných systémů.
Zdroje dat
73. Skenování periodik - obálky, obsahy
1060 periodik se skenuje celkem/77 500 stran
200 - Severočeská vědecká knihovna v Ústí nad Labem
175 - Jihočeská vědecká knihovna v Českých Budějovicích
154 - Národní knihovna ČR
95 - Knihovna Ústavního soudu
94 - Právnická fakulta – Masarykova univerzita
92 – Krajská knihovna Karlovy Vary
44 - Krajská vědecká knihovna Liberec
39 - Moravskoslezská vědecká knihovna v Ostravě
35 - Univerzita Palackého v Olomouci
26 - Moravská zemská knihovna
24 - Studijní a vědecká knihovna v Hradci Králové
11 - Univerzita Tomáše Bati ve Zlíně
6 - Pedagogická fakulta – Masarykova univerzita
4 - Univerzitní centrum Telč – Masarykova univerzita
4 - Teologická fakulta Jihočeské univerzity
3 - Archeologický ústav AV ČR
3 - Moravská galerie
2 - Přírodovědecká fakulta – Masarykova univerzita
2 - JABOK - Vyšší odborná škola sociálně ped. a teol.
74. Kontroly dat - https://servis.obalkyknih.cz/
Kontroly dat - https://servis.obalkyknih.cz/
78. Kontroly dat
Při kontrolách záznamů provadíme:
doplňování chybějících identifikátorů (číslo cnb, oclc, isbn)
doplňování popisných metadat pro zobrazování na stránkách projektu (název, autor, rok
vydání)
doplňování či úpravě anotace
výběru nejkvalitnější obálky (rozlišení, bez nálepek, …)
opravy chybných záznamů
propojení se záznamy (dílové tituly).
84. Podpora pro knihovny
Individuální projekty pro konkrétní knihovny:
… specifické výstupy, importy speciálních fondů, …
Knihovny Masarykovy univerzity
Národní památkový ústav
Masarykův ústav a Archiv AV ČR
NIPOS – Národní informační a poradenské středisko pro kulturu
88. Pomožme si sami …
Každá knihovna může přispět …
naskenovat obálky a obsahy svých dokumentů
a uložit je na obalkyknih.cz
!!! Výsledky práce využijí všichni !!!