Submit Search
Upload
学術コンテンツサービスでの活用事例@Lucene/Solr勉強会(2015.5.13)
•
11 likes
•
7,210 views
Ikki Ohmukai
Follow
学術コンテンツサービスでの活用事例@Lucene/Solr勉強会(2015.5.13)
Read less
Read more
Internet
Report
Share
Report
Share
1 of 26
Download now
Download to read offline
Recommended
つながる目録、つながるサービス@図書館総合展(2015.11.12)
つながる目録、つながるサービス@図書館総合展(2015.11.12)
Ikki Ohmukai
オープンデータをつかう図書館、オープンデータをつくる図書館(完全版)@京都図書館大会(2015.8.17)
オープンデータをつかう図書館、オープンデータをつくる図書館(完全版)@京都図書館大会(2015.8.17)
Ikki Ohmukai
ビジネスで使えるオープンデータの技術@ビジネス活用のためのオープンデータセミナー(2016.01.22)
ビジネスで使えるオープンデータの技術@ビジネス活用のためのオープンデータセミナー(2016.01.22)
Ikki Ohmukai
オープンデータをつかう図書館、オープンデータをつくる図書館@京都図書館大会(2015.8.17)
オープンデータをつかう図書館、オープンデータをつくる図書館@京都図書館大会(2015.8.17)
Ikki Ohmukai
2016年10月、神戸に LODの国際会議がやってくる!@神戸ITフェスティバル2015(2015.11.6)
2016年10月、神戸に LODの国際会議がやってくる!@神戸ITフェスティバル2015(2015.11.6)
Ikki Ohmukai
図書館とLinked Open Data@大学図書館問題研究会全国大会(2014.8.24)
図書館とLinked Open Data@大学図書館問題研究会全国大会(2014.8.24)
Ikki Ohmukai
国立情報学研究所のオープンデータに関する取り組み@図書館総合展(2013.10.30)
国立情報学研究所のオープンデータに関する取り組み@図書館総合展(2013.10.30)
Ikki Ohmukai
Linked Open Data入門@関西オープンデータEXPO(2015.2.11)
Linked Open Data入門@関西オープンデータEXPO(2015.2.11)
Ikki Ohmukai
Recommended
つながる目録、つながるサービス@図書館総合展(2015.11.12)
つながる目録、つながるサービス@図書館総合展(2015.11.12)
Ikki Ohmukai
オープンデータをつかう図書館、オープンデータをつくる図書館(完全版)@京都図書館大会(2015.8.17)
オープンデータをつかう図書館、オープンデータをつくる図書館(完全版)@京都図書館大会(2015.8.17)
Ikki Ohmukai
ビジネスで使えるオープンデータの技術@ビジネス活用のためのオープンデータセミナー(2016.01.22)
ビジネスで使えるオープンデータの技術@ビジネス活用のためのオープンデータセミナー(2016.01.22)
Ikki Ohmukai
オープンデータをつかう図書館、オープンデータをつくる図書館@京都図書館大会(2015.8.17)
オープンデータをつかう図書館、オープンデータをつくる図書館@京都図書館大会(2015.8.17)
Ikki Ohmukai
2016年10月、神戸に LODの国際会議がやってくる!@神戸ITフェスティバル2015(2015.11.6)
2016年10月、神戸に LODの国際会議がやってくる!@神戸ITフェスティバル2015(2015.11.6)
Ikki Ohmukai
図書館とLinked Open Data@大学図書館問題研究会全国大会(2014.8.24)
図書館とLinked Open Data@大学図書館問題研究会全国大会(2014.8.24)
Ikki Ohmukai
国立情報学研究所のオープンデータに関する取り組み@図書館総合展(2013.10.30)
国立情報学研究所のオープンデータに関する取り組み@図書館総合展(2013.10.30)
Ikki Ohmukai
Linked Open Data入門@関西オープンデータEXPO(2015.2.11)
Linked Open Data入門@関西オープンデータEXPO(2015.2.11)
Ikki Ohmukai
ウィキペディアを介してまちと図書館をつなぐ試み「ウィキペディア・タウン」
ウィキペディアを介してまちと図書館をつなぐ試み「ウィキペディア・タウン」
Iwao KOBAYASHI
オープンデータ×データビジュアライズ〜地域課題を可視化するためのヒント〜
オープンデータ×データビジュアライズ〜地域課題を可視化するためのヒント〜
Iwao KOBAYASHI
オープンデータ技術概論〜オープンデータからLinked Open Dataへ〜
オープンデータ技術概論〜オープンデータからLinked Open Dataへ〜
Iwao KOBAYASHI
自治体広報誌ネクストステップ
自治体広報誌ネクストステップ
Iwao KOBAYASHI
オープンデータで起業するためのヒント
オープンデータで起業するためのヒント
Iwao KOBAYASHI
ウィキペディアタウン: 市民による地域情報化の一手法
ウィキペディアタウン: 市民による地域情報化の一手法
Fumihiro Kato
LODチャレンジのご紹介
LODチャレンジのご紹介
Linked Open Dataチャレンジ実行委員会
シビックテック: インターネット時代の市民と行政の協働
シビックテック: インターネット時代の市民と行政の協働
Fumihiro Kato
ボトムアップで進む横浜のオープンデータ
ボトムアップで進む横浜のオープンデータ
Iwao KOBAYASHI
オープンデータ推進の課題とポイント
オープンデータ推進の課題とポイント
National Institute of Informatics (NII)
Welcome to opendata world
Welcome to opendata world
Nobuo Kawaguchi
なぜ5つ星オープンデータなのか ー リンクトオープンデータとオープンガバメント
なぜ5つ星オープンデータなのか ー リンクトオープンデータとオープンガバメント
Toru Takahashi
文化機関×オープンデータ
文化機関×オープンデータ
Iwao KOBAYASHI
Wikidata Edit-a-thon -Wikidataを編集してみよう!-
Wikidata Edit-a-thon -Wikidataを編集してみよう!-
Kouji Kozaki
ともに考え、ともにつくる社会 オープンガバメントシンポジウム in 東京大学公共政策大学院
ともに考え、ともにつくる社会 オープンガバメントシンポジウム in 東京大学公共政策大学院
Hal Seki
行政と市民によるオープンデータ共創支援プラットフォーム LinkData.org
行政と市民によるオープンデータ共創支援プラットフォーム LinkData.org
Sayoko Shimoyama
Osc2013北海道 opendata trend
Osc2013北海道 opendata trend
Kentaro Hatori
LODとメディア ニューヨークタイムズ最新事情
LODとメディア ニューヨークタイムズ最新事情
Linked Open Dataチャレンジ実行委員会
Review of International Open Data Day 2014 in Kyoto - OKFJ Open Data Talk 9
Review of International Open Data Day 2014 in Kyoto - OKFJ Open Data Talk 9
Toru Takahashi
オープンデータの広がりと今後の課題ー関西での活動を中心にー
オープンデータの広がりと今後の課題ー関西での活動を中心にー
Kouji Kozaki
20201104_趣旨説明
20201104_趣旨説明
Yasuyuki Minamiyama
オープンデータとは@芸術・文化情報とオープンデータ(2013.11.28)
オープンデータとは@芸術・文化情報とオープンデータ(2013.11.28)
Ikki Ohmukai
More Related Content
What's hot
ウィキペディアを介してまちと図書館をつなぐ試み「ウィキペディア・タウン」
ウィキペディアを介してまちと図書館をつなぐ試み「ウィキペディア・タウン」
Iwao KOBAYASHI
オープンデータ×データビジュアライズ〜地域課題を可視化するためのヒント〜
オープンデータ×データビジュアライズ〜地域課題を可視化するためのヒント〜
Iwao KOBAYASHI
オープンデータ技術概論〜オープンデータからLinked Open Dataへ〜
オープンデータ技術概論〜オープンデータからLinked Open Dataへ〜
Iwao KOBAYASHI
自治体広報誌ネクストステップ
自治体広報誌ネクストステップ
Iwao KOBAYASHI
オープンデータで起業するためのヒント
オープンデータで起業するためのヒント
Iwao KOBAYASHI
ウィキペディアタウン: 市民による地域情報化の一手法
ウィキペディアタウン: 市民による地域情報化の一手法
Fumihiro Kato
LODチャレンジのご紹介
LODチャレンジのご紹介
Linked Open Dataチャレンジ実行委員会
シビックテック: インターネット時代の市民と行政の協働
シビックテック: インターネット時代の市民と行政の協働
Fumihiro Kato
ボトムアップで進む横浜のオープンデータ
ボトムアップで進む横浜のオープンデータ
Iwao KOBAYASHI
オープンデータ推進の課題とポイント
オープンデータ推進の課題とポイント
National Institute of Informatics (NII)
Welcome to opendata world
Welcome to opendata world
Nobuo Kawaguchi
なぜ5つ星オープンデータなのか ー リンクトオープンデータとオープンガバメント
なぜ5つ星オープンデータなのか ー リンクトオープンデータとオープンガバメント
Toru Takahashi
文化機関×オープンデータ
文化機関×オープンデータ
Iwao KOBAYASHI
Wikidata Edit-a-thon -Wikidataを編集してみよう!-
Wikidata Edit-a-thon -Wikidataを編集してみよう!-
Kouji Kozaki
ともに考え、ともにつくる社会 オープンガバメントシンポジウム in 東京大学公共政策大学院
ともに考え、ともにつくる社会 オープンガバメントシンポジウム in 東京大学公共政策大学院
Hal Seki
行政と市民によるオープンデータ共創支援プラットフォーム LinkData.org
行政と市民によるオープンデータ共創支援プラットフォーム LinkData.org
Sayoko Shimoyama
Osc2013北海道 opendata trend
Osc2013北海道 opendata trend
Kentaro Hatori
LODとメディア ニューヨークタイムズ最新事情
LODとメディア ニューヨークタイムズ最新事情
Linked Open Dataチャレンジ実行委員会
Review of International Open Data Day 2014 in Kyoto - OKFJ Open Data Talk 9
Review of International Open Data Day 2014 in Kyoto - OKFJ Open Data Talk 9
Toru Takahashi
オープンデータの広がりと今後の課題ー関西での活動を中心にー
オープンデータの広がりと今後の課題ー関西での活動を中心にー
Kouji Kozaki
What's hot
(20)
ウィキペディアを介してまちと図書館をつなぐ試み「ウィキペディア・タウン」
ウィキペディアを介してまちと図書館をつなぐ試み「ウィキペディア・タウン」
オープンデータ×データビジュアライズ〜地域課題を可視化するためのヒント〜
オープンデータ×データビジュアライズ〜地域課題を可視化するためのヒント〜
オープンデータ技術概論〜オープンデータからLinked Open Dataへ〜
オープンデータ技術概論〜オープンデータからLinked Open Dataへ〜
自治体広報誌ネクストステップ
自治体広報誌ネクストステップ
オープンデータで起業するためのヒント
オープンデータで起業するためのヒント
ウィキペディアタウン: 市民による地域情報化の一手法
ウィキペディアタウン: 市民による地域情報化の一手法
LODチャレンジのご紹介
LODチャレンジのご紹介
シビックテック: インターネット時代の市民と行政の協働
シビックテック: インターネット時代の市民と行政の協働
ボトムアップで進む横浜のオープンデータ
ボトムアップで進む横浜のオープンデータ
オープンデータ推進の課題とポイント
オープンデータ推進の課題とポイント
Welcome to opendata world
Welcome to opendata world
なぜ5つ星オープンデータなのか ー リンクトオープンデータとオープンガバメント
なぜ5つ星オープンデータなのか ー リンクトオープンデータとオープンガバメント
文化機関×オープンデータ
文化機関×オープンデータ
Wikidata Edit-a-thon -Wikidataを編集してみよう!-
Wikidata Edit-a-thon -Wikidataを編集してみよう!-
ともに考え、ともにつくる社会 オープンガバメントシンポジウム in 東京大学公共政策大学院
ともに考え、ともにつくる社会 オープンガバメントシンポジウム in 東京大学公共政策大学院
行政と市民によるオープンデータ共創支援プラットフォーム LinkData.org
行政と市民によるオープンデータ共創支援プラットフォーム LinkData.org
Osc2013北海道 opendata trend
Osc2013北海道 opendata trend
LODとメディア ニューヨークタイムズ最新事情
LODとメディア ニューヨークタイムズ最新事情
Review of International Open Data Day 2014 in Kyoto - OKFJ Open Data Talk 9
Review of International Open Data Day 2014 in Kyoto - OKFJ Open Data Talk 9
オープンデータの広がりと今後の課題ー関西での活動を中心にー
オープンデータの広がりと今後の課題ー関西での活動を中心にー
Similar to 学術コンテンツサービスでの活用事例@Lucene/Solr勉強会(2015.5.13)
20201104_趣旨説明
20201104_趣旨説明
Yasuyuki Minamiyama
オープンデータとは@芸術・文化情報とオープンデータ(2013.11.28)
オープンデータとは@芸術・文化情報とオープンデータ(2013.11.28)
Ikki Ohmukai
オープンデータと環境未来都市
オープンデータと環境未来都市
Iwao KOBAYASHI
2014/06/19 第3回 CKAN コミュニティミーティング | homata
2014/06/19 第3回 CKAN コミュニティミーティング | homata
Hiroshi Omata
6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 小林巌生さんプレゼン資料
6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 小林巌生さんプレゼン資料
LOCAL GOOD YOKOHAMA
オープンデータ東海開催報告
オープンデータ東海開催報告
Nobuo Kawaguchi
150607ACN
150607ACN
Shintaro Eguchi
「HOME'Sデータセット」提供を通じた不動産領域におけるオープンイノベーション促進の取り組み
「HOME'Sデータセット」提供を通じた不動産領域におけるオープンイノベーション促進の取り組み
Yoji Kiyota
日本におけるLinked Dataの課題とその解決への試み
日本におけるLinked Dataの課題とその解決への試み
National Institute of Informatics (NII)
「HOME'Sデータセット」提供開始の背景 〜産学間データ共有の課題〜
「HOME'Sデータセット」提供開始の背景 〜産学間データ共有の課題〜
Yoji Kiyota
地域情報のデジタル化と“オープン”であることの意義 〜文化資料やWikipediaの活用と地域協働〜
地域情報のデジタル化と“オープン”であることの意義 〜文化資料やWikipediaの活用と地域協働〜
Toru Takahashi
オープンデータを利用したWebアプリ開発
オープンデータを利用したWebアプリ開発
dokechin
地域デザイン×オープンデータ
地域デザイン×オープンデータ
Iwao KOBAYASHI
シビックテックにとってのオープンデータ
シビックテックにとってのオープンデータ
Kouji Kozaki
1 2 introduction
1 2 introduction
CSISi
[All-in-one2015] データベース統合化の取り組みとNBDCで提供するサービス
[All-in-one2015] データベース統合化の取り組みとNBDCで提供するサービス
DNA Data Bank of Japan center
【UDC2015】第12回 - 福岡ブロック
【UDC2015】第12回 - 福岡ブロック
CSISi
LODチャレンジ応募作品からみえた日本のLODの可能性と今後の課題
LODチャレンジ応募作品からみえた日本のLODの可能性と今後の課題
Hiroyuki Sato
オープンデータフォーラム〜地方におけるオープンデータ〜「アイディアソン」
オープンデータフォーラム〜地方におけるオープンデータ〜「アイディアソン」
Sayoko Shimoyama
20140917 yahooall
20140917 yahooall
Nobuyuki Otomori
Similar to 学術コンテンツサービスでの活用事例@Lucene/Solr勉強会(2015.5.13)
(20)
20201104_趣旨説明
20201104_趣旨説明
オープンデータとは@芸術・文化情報とオープンデータ(2013.11.28)
オープンデータとは@芸術・文化情報とオープンデータ(2013.11.28)
オープンデータと環境未来都市
オープンデータと環境未来都市
2014/06/19 第3回 CKAN コミュニティミーティング | homata
2014/06/19 第3回 CKAN コミュニティミーティング | homata
6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 小林巌生さんプレゼン資料
6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 小林巌生さんプレゼン資料
オープンデータ東海開催報告
オープンデータ東海開催報告
150607ACN
150607ACN
「HOME'Sデータセット」提供を通じた不動産領域におけるオープンイノベーション促進の取り組み
「HOME'Sデータセット」提供を通じた不動産領域におけるオープンイノベーション促進の取り組み
日本におけるLinked Dataの課題とその解決への試み
日本におけるLinked Dataの課題とその解決への試み
「HOME'Sデータセット」提供開始の背景 〜産学間データ共有の課題〜
「HOME'Sデータセット」提供開始の背景 〜産学間データ共有の課題〜
地域情報のデジタル化と“オープン”であることの意義 〜文化資料やWikipediaの活用と地域協働〜
地域情報のデジタル化と“オープン”であることの意義 〜文化資料やWikipediaの活用と地域協働〜
オープンデータを利用したWebアプリ開発
オープンデータを利用したWebアプリ開発
地域デザイン×オープンデータ
地域デザイン×オープンデータ
シビックテックにとってのオープンデータ
シビックテックにとってのオープンデータ
1 2 introduction
1 2 introduction
[All-in-one2015] データベース統合化の取り組みとNBDCで提供するサービス
[All-in-one2015] データベース統合化の取り組みとNBDCで提供するサービス
【UDC2015】第12回 - 福岡ブロック
【UDC2015】第12回 - 福岡ブロック
LODチャレンジ応募作品からみえた日本のLODの可能性と今後の課題
LODチャレンジ応募作品からみえた日本のLODの可能性と今後の課題
オープンデータフォーラム〜地方におけるオープンデータ〜「アイディアソン」
オープンデータフォーラム〜地方におけるオープンデータ〜「アイディアソン」
20140917 yahooall
20140917 yahooall
More from Ikki Ohmukai
CiNii Researchと大学図書館(2018.6.18)
CiNii Researchと大学図書館(2018.6.18)
Ikki Ohmukai
知識インフラの本質と「未来の」ライブラリアンへの期待(2017.4.22)
知識インフラの本質と「未来の」ライブラリアンへの期待(2017.4.22)
Ikki Ohmukai
情報の構造化@Linked Open Data連続講座(2014.6.2)
情報の構造化@Linked Open Data連続講座(2014.6.2)
Ikki Ohmukai
オープンデータとLinked Open Data@筑波大学研究談話会(2013.12.18)
オープンデータとLinked Open Data@筑波大学研究談話会(2013.12.18)
Ikki Ohmukai
災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)
災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)
Ikki Ohmukai
地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)
地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)
Ikki Ohmukai
図書館データとLinked Open Data@国立国会図書館データベースフォーラム(2013.10.16)
図書館データとLinked Open Data@国立国会図書館データベースフォーラム(2013.10.16)
Ikki Ohmukai
オープンデータと「つながる社会」@オープンデータ京都勉強会(2013.04.20)
オープンデータと「つながる社会」@オープンデータ京都勉強会(2013.04.20)
Ikki Ohmukai
CiNii Booksに見る学術情報サービスの理想と現実@ku-librarians勉強会(2012.07.13)
CiNii Booksに見る学術情報サービスの理想と現実@ku-librarians勉強会(2012.07.13)
Ikki Ohmukai
050830 openforum
050830 openforum
Ikki Ohmukai
CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)
CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)
Ikki Ohmukai
セマンティック・ウェブと学術情報サービス@国立国会図書館講演会(2010.07.27)
セマンティック・ウェブと学術情報サービス@国立国会図書館講演会(2010.07.27)
Ikki Ohmukai
More from Ikki Ohmukai
(12)
CiNii Researchと大学図書館(2018.6.18)
CiNii Researchと大学図書館(2018.6.18)
知識インフラの本質と「未来の」ライブラリアンへの期待(2017.4.22)
知識インフラの本質と「未来の」ライブラリアンへの期待(2017.4.22)
情報の構造化@Linked Open Data連続講座(2014.6.2)
情報の構造化@Linked Open Data連続講座(2014.6.2)
オープンデータとLinked Open Data@筑波大学研究談話会(2013.12.18)
オープンデータとLinked Open Data@筑波大学研究談話会(2013.12.18)
災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)
災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)
地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)
地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)
図書館データとLinked Open Data@国立国会図書館データベースフォーラム(2013.10.16)
図書館データとLinked Open Data@国立国会図書館データベースフォーラム(2013.10.16)
オープンデータと「つながる社会」@オープンデータ京都勉強会(2013.04.20)
オープンデータと「つながる社会」@オープンデータ京都勉強会(2013.04.20)
CiNii Booksに見る学術情報サービスの理想と現実@ku-librarians勉強会(2012.07.13)
CiNii Booksに見る学術情報サービスの理想と現実@ku-librarians勉強会(2012.07.13)
050830 openforum
050830 openforum
CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)
CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)
セマンティック・ウェブと学術情報サービス@国立国会図書館講演会(2010.07.27)
セマンティック・ウェブと学術情報サービス@国立国会図書館講演会(2010.07.27)
学術コンテンツサービスでの活用事例@Lucene/Solr勉強会(2015.5.13)
1.
学術コンテンツサービスでの活用事例 国立情報学研究所 大向 一輝 @i2k
2.
自己紹介 • 対象 • ソーシャルメディア:ブログ・SNS・Twitter… •
学術情報サービス・ビブリオメトリクス • 技術 • セマンティックウェブ・Linked Open Data(LOD) • ネットワーク分析・データマイニング • クラウドソーシング • オープンデータ • 内閣官房 電子行政オープンデータ実務者会議 公開支援WG • 経済産業省 IT融合フォーラム 公共データWG • オープン&ビッグデータ活用・地方創生推進機構 利活用・普及委員会 • NPOリンクト・オープン・データ・イニシアティブ
3.
自己紹介
4.
国立情報学研究所(NII)
5.
NIIの2つのミッション 学術基盤推進部 「研究と事業を車の両輪として情報学による未来価値を創成」
6.
NIIの略史 年 月 事 項 昭和51(1976)年5月 東京大学情報図書館学研究センター発足 昭和58(1983)年4月 東京大学文献情報センター設置(情報図書館学研究 センターを改組) 昭和61(1986)年4月
学術情報センター(NACSIS)設置 平成12(2000)年4月 国立情報学研究所(NII)設置(学術情報センターの 廃止・転換) 平成16(2004)年4月 大学共同利用機関法人 情報・システム研究機構 国立情報学研究所設置
7.
図書館文化と検索技術 • 少なくとも2000年以上の歴史 • 大量の情報を「探す」「見つける」不変のミッション •
コンピュータ以前の検索 • 冊子体目録(カタログ) • カード目録 • 1960s∼:電算化とOPAC • 専門技能としての検索 • 厳密な記述規則と組織化 • 教育システム 出典:ndl.go.jp
8.
9.
図書館文化と検索技術 • 形態素解析?N-Gram? • 分かち書き •
分かち書きは、検索語となる自立語を対象とする。日 本語の場合は、日本語として不自然でない意味のまと まりで分かち書きを行う。 • 例外多数 • 地名に付属する「史」「誌」は地名との複合形をもっ て一語とする。また、地名に行政単位等を示す語が付 属する場合は、行政単位等を示す語と「史」「誌」と の複合形をもって一語とし、地名を分割する。 • 例:日本史 仙台史 愛知△県史
10.
図書館文化と検索技術 • かな漢字変換? • 読みの付与 •
ウェブらしさを考える本 • →ウェブ△ラシサ△ヲ△カンガエル△ホン • 三國志 • →サンゴクシ?san guo zhi? • 多言語対応 • 翻字と包摂 • ß→ss Д→d 谷→穀 • ローマ字入力:ヘボン式?訓令式?
11.
包摂の例
12.
図書館文化と検索技術 • 各言語の取り扱いは国ごと・言語圏ごとに大きく異なる • グローバルに1つの検索エンジンは可能か? •
初学者の存在 • 文化受容の歴史(和製英語・和製漢語) • 大学図書館・研究図書館における再現率の重視 • 引用・被引用関係に基づく確からしさの評価 • 見逃しは許されない • 情報システムとしての要求の変化 • 専門家のための道具から一般向けのサービスへ • インターネット・ウェブ
13.
NIIの学術コンテンツサービス 論文 CiNii Articles NII-ELS /
REO 図書・雑誌 CiNii Books NACSIS-CAT 報告書 KAKEN 機関リポジトリ JAIRO JAIRO Cloud
14.
2つのCiNii 1800万件の 日本語論文データを検索 800万件はダウンロード可能 大学図書館1200館の 1100万種類・1億2000万冊の 本のデータを検索 Articles Books
15.
Articles Books
16.
Articles API Books API OpenSearch 100,946,269 RDF 182,235,701 OpenSearch 9,902,483 RDF 8,512,362
17.
2つ(3つ)のCiNii • CiNiiArticles(2009∼)論文 • 検索エンジン:某社某パッケージ+Solr •
DB:PostgreSQL • CiNii Books(2011∼)図書 • 検索エンジン:Solr • DB:MySQL • CiNii Dissertations(2015∼)博士論文 • 検索・DB:ElasticSearch • UI/UXは統一、中身は別物 • データ構造の違い・潜在的ユーザ数の違い(A>>B>>D) • 適材適所の技術導入・楽しく開発!
18.
CiNii BooksとSolr • Articlesは2007年仕様策定、当時はOSS採用への抵抗感あり •
Booksは2009年開発開始、事例の増加と商用パッケージはエ ンタープライズ検索に特化傾向 • 図書館文化との親和性 • 多言語が同一フィールドに混在する • アルファベットはスペース区切り、他の文字はN-Gram としたい→CJKTokenizerの拡張 • 漢字統合を含む多段的な包摂・正規化処理が必要 • 業務で作られたルールセットをそのまま利用可能に • https://github.com/atware/lucene-tokenizers-for-multilang • ルールセットは未公開…
19.
CiNii BooksとSolr • 搭載データ •
書誌:11,055,402 • 著者:1,656,648 • 週次で全件を再投入(業務プロセス簡略化のため) • 安定稼働 • リリース以来Solr起因のトラブルは皆無 • 法定停電時はパブリッククラウドでサービス継続 • 継続的課題 • スケーラビリティ:大ヒットしてもコストがかけられない • 可用性:3.11の教訓・お役所的勤務体系 • ElasticSearchのテスト・KAKEN/SEIKAの挑戦
20.
21.
KAKEN/SEIKA • KAKEN:科学研究費補助金の成果報告書データベース • 年間2000億円超の研究費の説明責任と成果のショーケース •
研究費獲得のための先行研究調査 • データ:課題78万件・報告書138万件 • アクセス:検索400万・詳細表示2200万・PDFダウン ロード80万 • 要求の変化 • 毎年変更される分類体系への追従 • 他省庁の補助金制度への対応 • 現行システムはHyper Estraier+MySQL • スケーラビリティ・可用性
22.
科研費の細目
23.
24.
25.
新KAKEN/SEIKA • Riakベース • 分散KVS •
分類体系の変更に追従しやすい • スケーラビリティ・可用性への配慮 • Version 2.0から検索エンジンにSolrを採用 • 疎結合のアーキテクチャにより責任分界とメンテナン スが容易 • Solrコミュニティの成果を生かしやすい • 10月リリース予定
26.
まとめ • 図書館文化と検索技術 • ウェブの母体 •
自然言語処理と意味処理の融合体 • 確率モデルとグラフモデルによる次世代の検索へ
Download now