SlideShare a Scribd company logo
1 of 23
Download to read offline
GLAMtech
これまでの道のり
GLAMtech Vol.6
2018年2月3日(土)
高久雅生(筑波大学)
1
GLAMtechのこれまで
1. 小規模館において持続可能な資料管理・提供の
仕組みと技術を考える (2017-05-01)
2. 教科書LODプロジェクトに学ぶ、小規模館におけ
る持続可能な資料管理・提供の仕組みと技術
(2017-06-18)
3. GitHubのissueとreleaseをやってみる (2017-07-23)
4. Data Publishing! (2017-09-23)
Season2 : Asset management
5. 小規模館において持続可能な資料管理・提供の
仕組みと技術を考える (2017-11-25)
6. GithubとFlickrでつくる収蔵資料ページ (2018-02-
03)
2
Season1 の振り返り
• 小規模館が手元の資料(小規模データセッ
トを)お手軽に安価に提供し、メンテナン
スしていくための枠組みとは?
教科書LOD(約7000冊分;毎年更新)
特定歴史公文書等目録(東工大資史料館)
…
• (前提)
書誌情報(メタデータ)のみを扱う
一定の構造化ができている(不完全でよい)
 レコードの記述が項目毎に区別できるよう分けら
れており、Excel等で管理できるレベル
3
事例:教科書LOD
• https://jp-textbook.github.io/
• 枠組み
構造化(リソースと属性定義) Vol.2
データセット作成(RDFデータ作成) Vol.2
公開保守のための枠組み(Github) Vol.3
データ公開,発信! Vol.4
4
教科書LODとは
• 教科書の書誌データをLOD化
• 教科書を URI (IRI) で一意に示せる・利用
可能に
5
https://w3id.org/jp-textbook/高等学校/2006/世B/013
例:高等学校で使われている「世界史B」の教科書
(2006年に検定済み(奥付に記載あり)、東京書籍が出版)
教科書記号(例:世B)及び教科書番号(例:013)
教科書のわかりやすいところに記載さている
(文部科学省が検定済教科書を整理・周知する際に使用)
高等学校地理歴史教科用
文部科学省検定済教科書
2 東書 世B 013
教科書の奥付の一部
※平成18年=2006年
平成18年3月20日検定済
2|東書|世B013
教科書の表紙の左上
6
https://w3id.org/jp-textbook/
URIを指定すれば、基本的な情報を閲覧可能
トップページから教科や種目(科目)などでブラウジング可能
Turtle形式のファイルでも全RDFデータを一括ダウンロード可能
教科書LODデータモデルの説明ドキュメントあり
7
書名、出版者などの「本」としての基本的な情報
教育関連で基本的な情報:
学校種別、学年、教科、使用年度、検定年、
対応する学習指導要領など
教育図書館の資料検索結果へのリンク
教科書LODのデータモデル:
教科書についての基本的な情報を記述
8
種目がある
教科書LODの構築
• 国立教育政策教育図書館の保有する現行の
検定制度の教科書の書誌情報を提供いただ
いて研究用に開発
対象:約7000件の書誌情報(タイトルや教科
等)に対してURI付与
安定した情報の修正・追加(データ作成機関
(教育図書館)との連携)
• 付随するすべての教科・種目(科目)、学
習指導要領や教科書目録に対してもURIを付
与
• 外部サービスの活用
Githubページ
固定URIサービス(w3id.org)など
9
教科書LOD構築の流れ
書誌情報
データベース
図書館システム
TSVエクス
ポート出力
編集
URI追加
csv2ttl.rb
Turtle
ファイル
CSVエクス
ポート出力
Rubyスク
リプトHTMLファイル群
Git push
Excel
人手で作成/出力
Copy&Paste 10
1. 構造化
記述対象を決定して、その属性を決めよう!
11
属性を決める
• 適当なものを定める
まずはお手軽に
 深く考えない、あとで直せばよい
本気でやるなら、業界での標準的な語彙セット
や関連データセットの調査を
 LODstatsやdatahub等のツールも
データセット特有の独自項目等は独自の語彙を
定義
• ウェブと親和性が高いのであれば、
Schema.org 語彙セット+αから始める
名称(タイトル)-> schema:title
対象学年 -> textbook:grade
所蔵請求記号 -> nier:callNumber
12
URI を定める
• Permanent URL サービスを検討する
自身の所属組織のドメイン名も消えてなく
なる未来を想定…
• 著名な固定URIサービス
https://w3id.org
 W3C Permanent Identifier Community Group 運営
https://purl.org
 Internet Archive 運営
• いずれも、固定URIサービスのドメイン
名+自身のプロジェクト名以下でURIを
固定化
https://w3id.org/jp-textbook/xxxx
13
2.データセット作成
まずはRDFモデルに則ったデータを作ってみる
14
RDFデータ作成
• Turtle形式が最も一般的なデータ形式
もっとお手軽に実施するなら LinkData.org 等
のサービスもあるが…
• “Poorman’s Linked Data Toolkit”
15
Poorman’s Linked Data Toolkit
• Excel
1行を1レコードとみなし、いくつかのセル
の値を &(文字列結合演算子)でつなげて
いくだけ(お手軽)
出力には:
 列をコピーし、MS Wordへペースト (Excel to
word)
 MS Word を全コピーし、テキストエディタに
ペースト (Word to Text)
 Turtleファイルとして保存(例: “filename.ttl”)
(Turtle)
16
3. データ公開と保守
無料でお手軽に公開+保守
17
Github
• バージョンコントロール
変更履歴がたどれる
• クラウド環境
• 無料で使える
18
2つの機能:公開+保守
• 公開
Github Pages
無料で公開するためのホスティングサービス
• 保守
GithubのIssue機能(課題管理機能)
19
Github Pages
• Githubサイトでリポジトリを作成して、
Github Pagesで公開する!
• https://(プロジェクト名).github.io/xxx と
いうアドレスで公開される
このアドレスに固定URIサービスのリダイレ
クト先を振り向ける
https://w3id.org の場合:
 Github 上で Pull Request を送って対応依頼
https://purl.org の場合:
 ウェブ上でフォームから設定できる(らしい)
20
Github Issues
• データ保守+語彙保守
どのようにデータが追加されたか、データ
属性が変わったかを追跡できるようにして
おく
21https://github.com/jp-textbook/jp-textbook.github.io/issues
4. 最終版を公開
データセット公開! ウェブで宣伝!
22
LODデータセットの場合
ウェブの場合
• Google-ability をあげる
• LODデータセットを宣伝
23

More Related Content

More from Masao Takaku

高久研究室の紹介(KLIS MILK 2015-10)
高久研究室の紹介(KLIS MILK 2015-10)高久研究室の紹介(KLIS MILK 2015-10)
高久研究室の紹介(KLIS MILK 2015-10)Masao Takaku
 
研究室紹介・高久研究室
研究室紹介・高久研究室研究室紹介・高久研究室
研究室紹介・高久研究室Masao Takaku
 
Linked Dataの概要と課題
Linked Dataの概要と課題Linked Dataの概要と課題
Linked Dataの概要と課題Masao Takaku
 
高久研究室・研究室紹介
高久研究室・研究室紹介高久研究室・研究室紹介
高久研究室・研究室紹介Masao Takaku
 
Wikipediaとは? Wikipediaに投稿する方法
Wikipediaとは? Wikipediaに投稿する方法Wikipediaとは? Wikipediaに投稿する方法
Wikipediaとは? Wikipediaに投稿する方法Masao Takaku
 
研究室紹介:高久研究室
研究室紹介:高久研究室研究室紹介:高久研究室
研究室紹介:高久研究室Masao Takaku
 
Helping Memory Institutions in the Networked Information Society
Helping Memory Institutions in the Networked Information SocietyHelping Memory Institutions in the Networked Information Society
Helping Memory Institutions in the Networked Information SocietyMasao Takaku
 
20131123 enjukaigi
20131123 enjukaigi20131123 enjukaigi
20131123 enjukaigiMasao Takaku
 
研究室紹介 (情報経営・図書館主専攻)
研究室紹介 (情報経営・図書館主専攻)研究室紹介 (情報経営・図書館主専攻)
研究室紹介 (情報経営・図書館主専攻)Masao Takaku
 
「ふわっと関連検索」のこれまでとこれから
「ふわっと関連検索」のこれまでとこれから「ふわっと関連検索」のこれまでとこれから
「ふわっと関連検索」のこれまでとこれからMasao Takaku
 
流通する学術情報コンテンツ: 概論
流通する学術情報コンテンツ: 概論流通する学術情報コンテンツ: 概論
流通する学術情報コンテンツ: 概論Masao Takaku
 
Code4Lib 2013参加報告
Code4Lib 2013参加報告Code4Lib 2013参加報告
Code4Lib 2013参加報告Masao Takaku
 
東日本大震災発生期のツイッターにおける地域発信情報の分析
東日本大震災発生期のツイッターにおける地域発信情報の分析東日本大震災発生期のツイッターにおける地域発信情報の分析
東日本大震災発生期のツイッターにおける地域発信情報の分析Masao Takaku
 
茨城県つくば市における地域情報発信の様子を振り返る試み
茨城県つくば市における地域情報発信の様子を振り返る試み茨城県つくば市における地域情報発信の様子を振り返る試み
茨城県つくば市における地域情報発信の様子を振り返る試みMasao Takaku
 
物質・材料研究機構におけるNext-L Enjuの導入事例
物質・材料研究機構におけるNext-L Enjuの導入事例物質・材料研究機構におけるNext-L Enjuの導入事例
物質・材料研究機構におけるNext-L Enjuの導入事例Masao Takaku
 
saveMLAKウィキにおける共同編集コンテンツ分析の試み
saveMLAKウィキにおける共同編集コンテンツ分析の試みsaveMLAKウィキにおける共同編集コンテンツ分析の試み
saveMLAKウィキにおける共同編集コンテンツ分析の試みMasao Takaku
 

More from Masao Takaku (20)

高久研究室の紹介(KLIS MILK 2015-10)
高久研究室の紹介(KLIS MILK 2015-10)高久研究室の紹介(KLIS MILK 2015-10)
高久研究室の紹介(KLIS MILK 2015-10)
 
研究室紹介・高久研究室
研究室紹介・高久研究室研究室紹介・高久研究室
研究室紹介・高久研究室
 
Linked Dataの概要と課題
Linked Dataの概要と課題Linked Dataの概要と課題
Linked Dataの概要と課題
 
高久研究室・研究室紹介
高久研究室・研究室紹介高久研究室・研究室紹介
高久研究室・研究室紹介
 
JuNii2 Validator
JuNii2 ValidatorJuNii2 Validator
JuNii2 Validator
 
Web API入門
Web API入門Web API入門
Web API入門
 
Wikipediaとは? Wikipediaに投稿する方法
Wikipediaとは? Wikipediaに投稿する方法Wikipediaとは? Wikipediaに投稿する方法
Wikipediaとは? Wikipediaに投稿する方法
 
研究室紹介:高久研究室
研究室紹介:高久研究室研究室紹介:高久研究室
研究室紹介:高久研究室
 
Helping Memory Institutions in the Networked Information Society
Helping Memory Institutions in the Networked Information SocietyHelping Memory Institutions in the Networked Information Society
Helping Memory Institutions in the Networked Information Society
 
20131123 enjukaigi
20131123 enjukaigi20131123 enjukaigi
20131123 enjukaigi
 
研究室紹介 (情報経営・図書館主専攻)
研究室紹介 (情報経営・図書館主専攻)研究室紹介 (情報経営・図書館主専攻)
研究室紹介 (情報経営・図書館主専攻)
 
研究室紹介
研究室紹介研究室紹介
研究室紹介
 
「ふわっと関連検索」のこれまでとこれから
「ふわっと関連検索」のこれまでとこれから「ふわっと関連検索」のこれまでとこれから
「ふわっと関連検索」のこれまでとこれから
 
流通する学術情報コンテンツ: 概論
流通する学術情報コンテンツ: 概論流通する学術情報コンテンツ: 概論
流通する学術情報コンテンツ: 概論
 
Code4Lib 2013参加報告
Code4Lib 2013参加報告Code4Lib 2013参加報告
Code4Lib 2013参加報告
 
saveMLAK project
saveMLAK projectsaveMLAK project
saveMLAK project
 
東日本大震災発生期のツイッターにおける地域発信情報の分析
東日本大震災発生期のツイッターにおける地域発信情報の分析東日本大震災発生期のツイッターにおける地域発信情報の分析
東日本大震災発生期のツイッターにおける地域発信情報の分析
 
茨城県つくば市における地域情報発信の様子を振り返る試み
茨城県つくば市における地域情報発信の様子を振り返る試み茨城県つくば市における地域情報発信の様子を振り返る試み
茨城県つくば市における地域情報発信の様子を振り返る試み
 
物質・材料研究機構におけるNext-L Enjuの導入事例
物質・材料研究機構におけるNext-L Enjuの導入事例物質・材料研究機構におけるNext-L Enjuの導入事例
物質・材料研究機構におけるNext-L Enjuの導入事例
 
saveMLAKウィキにおける共同編集コンテンツ分析の試み
saveMLAKウィキにおける共同編集コンテンツ分析の試みsaveMLAKウィキにおける共同編集コンテンツ分析の試み
saveMLAKウィキにおける共同編集コンテンツ分析の試み
 

GLAMtechこれまでの道のり