SlideShare a Scribd company logo
1 of 31
Download to read offline
はてなブックマークに基づく
関連記事レコメンドエンジンの開発
Hatena Engineer Seminar #5
id:skozawa
1
自己紹介
小澤俊介 (id:skozawa / @5kozawa)
2007-2012
大学院で自然言語処理の研究に従事
2012
株式会社はてな入社
アプリケーションエンジニア
・プラットフォームチーム(アドテク)、ブックマークチーム
2
関連エントリー
http://b.hatena.ne.jp/entry/developer.hatenastaff.com/entry/engineer-seminar-5 3
関連エントリー
関連エントリーなし
http://b.hatena.ne.jp/entry/www.afpbb.com/articles/-/3050993
4
関連記事レコメンド
● 既存のアルゴリズム
○ タグを利用して関連記事を計算
● 関連記事レコメンドエンジンのプロトタイプ開発
○ タグがなくても、コンテンツを利用
○ パーソナライズを視野に(今回はできてません)
5
関連記事とは
● 関連記事
○ ある記事との間に繋がりのある記事
● 類似記事との関係
○ 関連記事 ≠ 類似記事 ?
○ 関連記事 ∋ 類似記事?
「関連」とは by goo辞書
ある事柄と他の事柄との間につながりがあること。連関。
「―が深い」「―する事柄」「―性」「―質問」
6
レシピで考える関連記事
● カレー粉で作る野菜のキーマカレー
● 市販ルゥで簡単手間なしキーマカレー
● 本格チキンカレー
● 残りのカレーで作る カレーうどんのレシピ
● 簡単に出来る☆濃厚ホワイトシチュー
● ほうれん草と鮭のクリームシチュー
● やみつきになる!漬け焼きタンドリーチキン
● パオバジの作り方 レシピ
● ナンのレシピ(ナンの作り方)
● トマトときゅうりのパクパクサラダ
● ソーセージとざく切り野菜のポトフ レシピ
● おでんのレシピ/作り方
7
「キーマカレーの作り方」
レシピで考える関連記事
● カレー粉で作る野菜のキーマカレー
● 市販ルゥで簡単手間なしキーマカレー
● 本格チキンカレー
● 残りのカレーで作る カレーうどんのレシピ
● 簡単に出来る☆濃厚ホワイトシチュー
● ほうれん草と鮭のクリームシチュー
● やみつきになる!漬け焼きタンドリーチキン
● パオバジの作り方 レシピ
● ナンのレシピ(ナンの作り方)
● トマトときゅうりのパクパクサラダ
● ソーセージとざく切り野菜のポトフ レシピ
● おでんのレシピ/作り方
8
「キーマカレーの作り方」
類似
主題
構成要素
カテゴリ
補助
用途/目的
関連記事レコメンド
● 記事のおすすめ
○ ユーザの興味のある記事
*今回はパーソナライズはできてません
○ 関連性とは別の軸
■ あたらしさ、おもしろさ
「レコメンド」とは by コトバンク
1 勧めること。推薦すること。「CDを―する」
2 オンラインショップなどで、利用者の好みにあった物品やサービスを
推薦する手法。利用者の購入履歴やアンケート、好みが似た他の利用
者の情報を分析し、適切な物品やサービスを絞り込んで推薦することに
より、売り上げを高めるのがねらい。レコメンデーション。
9
既存のアプローチ
● ユーザの付けたタグ情報を利用
○ ユーザが抽象化してくれる
○ ElasticsearchのMore Like Thisを利用
10
手法の流れ
11
入力記事
類似記事
1. 類似記事検索
キーマカレー
ひき肉
トマト
カレー
インド
作り方
にんにく
煮込む
キーマカレー、
カレー、作り方
ひき肉、トマト、
にんにく
インド、煮込む
特徴語
2. 特徴語抽出 3. 特徴語分類
関連記事
4. 関連記事検索
関連記事
(スコアリング済)
5. スコアリング
特徴語(分類)
手法の流れ
12
入力記事
類似記事
1. 類似記事検索
キーマカレー
ひき肉
トマト
カレー
インド
作り方
にんにく
煮込む
キーマカレー、
カレー、作り方
ひき肉、トマト、
にんにく
インド、煮込む
特徴語
2. 特徴語抽出 3. 特徴語分類
関連記事
4. 関連記事検索
関連記事
(スコアリング済)
5. スコアリング
特徴語(分類)
抽象化
手法の流れ
13
入力記事
類似記事
1. 類似記事検索
キーマカレー
ひき肉
トマト
カレー
インド
作り方
にんにく
煮込む
キーマカレー、
カレー、作り方
ひき肉、トマト、
にんにく
インド、煮込む
特徴語
2. 特徴語抽出 3. 特徴語分類
関連記事
4. 関連記事検索
関連記事
(スコアリング済)
5. スコアリング
特徴語(分類)
類似記事取得
● 単一文書から抽象化するのは困難
● 類似記事を収集
○ Elasticsearch More Like This
More Like This Query
● 類似文書を検索する機能
● 入力記事からTF-IDFの高い単語を抽出し、それを利用して記事を検索
14
類似記事検索例
● More Like This Query例
● 類似検索結果の例
15
{ “body”: { “query”: { “filtered”: {
“query”: { “more_like_this”: { “fields” : “content” } }
} } } }
キーマカレーのレシピ
インドカレーの別顔「キーマカレー」のレシピ(作り方)
キーマカレーの作り方1[準備編]
インド人シェフに学ぶ、本格キーマカレーの作り方
キーマカレー1
じゃがいもとナスのサブジ
近所のインド系おばあちゃん直伝!「キーマカレー」の作り方
インド人に聞いた牛ひき肉のキーマカレーの作り方
手法の流れ
16
入力記事
類似記事
1. 類似記事検索
キーマカレー
ひき肉
トマト
カレー
インド
作り方
にんにく
煮込む
キーマカレー、
カレー、作り方
ひき肉、トマト、
にんにく
インド、煮込む
特徴語
2. 特徴語抽出 3. 特徴語分類
関連記事
4. 関連記事検索
関連記事
(スコアリング済)
5. スコアリング
特徴語(分類)
特徴語抽出
● 類似文書集合から特徴語を抽出
○ 類似文書中でよく表れる単語
● Elasticsearch mtermvector API
17
term score = 類似文書集合中での文書頻度
全文書集合中での文書頻度
DFsimilar
log DFall
{ "docs": [ { "term_vectors": { "content" { "terms" {
"たまねぎ": { "doc_freq": 675, "term_freq": 1, "tokens": [ { "position": 118 } ] },
"カレー": { "doc_freq": 8816, "term_freq": 1, "tokens": [ { "position": 11 } ] },
"キーマカレ": { "doc_freq": 218, "term_freq": 2, "tokens": [ { "position": 22 }, {
"position": 60 } ] },
"トマト": { "doc_freq": 6006, "term_freq": 1, "tokens": [ { "position": 135 } ] },
...
} } } } ] }
特徴語抽出例
18
term score
キーマカレー 1
ひき肉 0.82
ターメリック 0.81
にんにく 0.79
ガラムマサラ 0.78
塩 0.78
トマト 0.77
煮込む 0.73
サラダ油 0.72
大さじ 0.71
term score
みじん切り 0.70
カレー 0.68
炒める 0.68
小さじ 0.67
作り方 0.66
レシピ 0.66
インド 0.66
g 0.65
材料 0.64
料理 0.61
手法の流れ
19
入力記事
類似記事
1. 類似記事検索
キーマカレー
ひき肉
トマト
カレー
インド
作り方
にんにく
煮込む
キーマカレー、
カレー、作り方
ひき肉、トマト、
にんにく
インド、煮込む
特徴語
2. 特徴語抽出 3. 特徴語分類
関連記事
4. 関連記事検索
関連記事
(スコアリング済)
5. スコアリング
特徴語(分類)
特徴語分類のための類似度計算
● 特徴語を性質によって分類
○ 主題、構成要素、カテゴリ など
● 類似度
20
Jaccard係数 =
単語Aかつ単語Bを含む記事数
単語Aまたは単語Bを含む記事数
類似度 =
「カレー」かつ「玉ねぎ」を含む記事数
「カレー」または「玉ねぎ」を含む記事数
特徴語分類のための類似度計算
● 特徴語を性質によって分類
○ 主題、構成要素、カテゴリ など
● 類似度
○ 「単語Aかつ単語Bを含む」の条件
■ ある一定の距離内で共起
■ 同じ文脈に出現する単語は性質が似ている
21
Jaccard係数 =
単語Aかつ単語Bを含む記事数
単語Aまたは単語Bを含む記事数
{ "docs": [ { "term_vectors": { "content" { "terms" {
"たまねぎ": { "doc_freq": 675, "term_freq": 1, "tokens": [ { "position": 118 } ] },
"カレー": { "doc_freq": 8816, "term_freq": 1, "tokens": [ { "position": 11 } ] },
} } } } ] }
特徴語分類
● 最短距離法
○ 距離が最も短い(類似度が最も高い)特徴語で
クラスタを形成
22
クラスA キーマカレ、カレー、作り方、レシピ、料理
クラスB ひき肉、トマト、にんにく、塩、サラダ油、g、材料
クラスC ターメリック、ガラムマサラ
クラスD 煮込む、インド
クラスE 大さじ、小さじ
クラスF みじん切り、炒める
手法の流れ
23
入力記事
類似記事
1. 類似記事検索
キーマカレー
ひき肉
トマト
カレー
インド
作り方
にんにく
煮込む
キーマカレー、
カレー、作り方
ひき肉、トマト、
にんにく
インド、煮込む
特徴語
2. 特徴語抽出 3. 特徴語分類
関連記事
4. 関連記事検索
関連記事
(スコアリング済)
5. スコアリング
特徴語(分類)
関連記事検索
● 分類したクエリクラスごとに記事を検索
○ クエリの過半数を含む
24
関連記事検索例(1)
25
キーマカレ、カレー、作り方、レシピ、料理
レシピの備忘録 大豆とひき肉のキーマカレー
インド人に聞いた牛ひき肉のキーマカレーの作り方
ひよこ豆と鶏ひき肉のキーマカレー
ひき肉、トマト、にんにく、塩、サラダ油、g、材料
きのこのミートボールシチュー
時短料理~丼もの編~:2色そぼろ丼
野菜たっぷりひき肉とひよこ豆のクミントマト煮、クスクス添え
ターメリック、ガラムマサラ
タンドリーサンマ
ガラムマサラ スパイス 香辛料 お徳用 業務用 ブレンド済みミックススパイス
激旨グルメブログ ガラムマサラ
関連記事検索例(2)
26
煮込む、インド
インド発、世界 2010
インド旅行記
味噌煮込みロジバン
大さじ、小さじ
大さじ 小さじ の分量
大さじ・小さじを英語で
大さじ小さじ
みじん切り、炒める
アンチョビ、ベーコン、ほうれん草の油炒め
タコのドライトマト炒め
牛肉の黒コショウ炒め
関連度
● 各検索結果に対して関連度を割り当てる
27
関連度 = 検索適合度 × クエリスコア
検索適合度:TF-IDFスコア(ESのスコア)を正規化した値
クエリスコア:クエリクラス中のterm scoreの最大値
キーマカレ、カレー、作り方、レシピ、料理 1.00
レシピの備忘録 大豆とひき肉のキーマカレー 1.00
インド人に聞いた牛ひき肉のキーマカレーの作り方 0.93
ひよこ豆と鶏ひき肉のキーマカレー 0.91
煮込む、インド 0.73
インド発、世界 2010 1.00
インド旅行記 0.91
味噌煮込みロジバン 0.71
手法の流れ
28
入力記事
類似記事
1. 類似記事検索
キーマカレー
ひき肉
トマト
カレー
インド
作り方
にんにく
煮込む
キーマカレー、
カレー、作り方
ひき肉、トマト、
にんにく
インド、煮込む
特徴語
2. 特徴語抽出 3. 特徴語分類
関連記事
4. 関連記事検索
関連記事
(スコアリング済)
5. スコアリング
特徴語(分類)
スコアリング
● 新鮮度
○ 最新の記事であるほど高い値
● おもしろさ
○ ブクマ数が多いほど高い値
○ バズリやすさを推定
■ 詳細は省略
29
スコア = 関連度 × 新鮮度 × おもしろさ
関連度:入力記事との関連性を表す値
新鮮度:記事の新しさを表す値
おもしろさ:記事のおもしろさを表す値
スコアリング結果
A. 【保存版】今さら聞けない!? 握らないおにぎり「おにぎらず」がキレイに作れるコツ
A. 近所のインド系おばあちゃん直伝!「キーマカレー」の作り方
B. アヒージョからカステラまで、たこ焼き器だけでできるフルコースレシピ
A. タマネギと挽肉のカレーが便利最高
A. 夏向けのスッキリしたカレーを作るざんす
B. 酸味の効いた四川料理のスープ「酸辣湯(サンラータン)」
D. プロに聞く!美味カレー5つの鉄則
A. ターメリックライスで食べる「キーマカレー」
C. ガラムマサラの話
A. 大豆とひき肉のキーマカレー
30
A. キーマカレ、カレー、作り方、レシピ、料理
B. ひき肉、トマト、にんにく、塩、サラダ油、g、材料
C. ターメリック、ガラムマサラ
D. 煮込む、インド
まとめ
● 関連記事レコメンドエンジンのプロトタイプ実装
● 今後
○ アルゴリズムの洗練
■ ユーザタグの活用
■ クラスタリング手法の改善
○ パーソナライズ
○ 評価
31

More Related Content

What's hot

Elasticsearch 変わり種プラグインの作り方
Elasticsearch 変わり種プラグインの作り方Elasticsearch 変わり種プラグインの作り方
Elasticsearch 変わり種プラグインの作り方Ryoji Kurosawa
 
ElasticSearch+Kibanaでログデータの検索と視覚化を実現するテクニックと運用ノウハウ
ElasticSearch+Kibanaでログデータの検索と視覚化を実現するテクニックと運用ノウハウElasticSearch+Kibanaでログデータの検索と視覚化を実現するテクニックと運用ノウハウ
ElasticSearch+Kibanaでログデータの検索と視覚化を実現するテクニックと運用ノウハウKentaro Yoshida
 
いろいろ考えると日本語の全文検索もMySQLがいいね!
いろいろ考えると日本語の全文検索もMySQLがいいね!いろいろ考えると日本語の全文検索もMySQLがいいね!
いろいろ考えると日本語の全文検索もMySQLがいいね!Kouhei Sutou
 
みんな大好き“全文検索 on AWS”を試してみました!
みんな大好き“全文検索 on AWS”を試してみました!みんな大好き“全文検索 on AWS”を試してみました!
みんな大好き“全文検索 on AWS”を試してみました!宗 大栗
 
MySQLユーザ視点での小さく始めるElasticsearch
MySQLユーザ視点での小さく始めるElasticsearchMySQLユーザ視点での小さく始めるElasticsearch
MySQLユーザ視点での小さく始めるElasticsearchKentaro Yoshida
 
CAジャーナルクラブ Dremel: Interactive Analysis of Web-Scale Datasets
CAジャーナルクラブ Dremel: Interactive Analysis of Web-Scale DatasetsCAジャーナルクラブ Dremel: Interactive Analysis of Web-Scale Datasets
CAジャーナルクラブ Dremel: Interactive Analysis of Web-Scale DatasetsNaoyuki Yamada
 
SolrとElasticsearchを比べてみよう
SolrとElasticsearchを比べてみようSolrとElasticsearchを比べてみよう
SolrとElasticsearchを比べてみようShinsuke Sugaya
 
My sqlで2億件のシリアルデータと格闘した話
My sqlで2億件のシリアルデータと格闘した話My sqlで2億件のシリアルデータと格闘した話
My sqlで2億件のシリアルデータと格闘した話saiken3110
 
Azure サービスを活用して作るフルマネージドな全文検索アプリケーション
Azure サービスを活用して作るフルマネージドな全文検索アプリケーションAzure サービスを活用して作るフルマネージドな全文検索アプリケーション
Azure サービスを活用して作るフルマネージドな全文検索アプリケーションYoichi Kawasaki
 
Elasticsearch Authプラグインでアクセスコントロール
Elasticsearch AuthプラグインでアクセスコントロールElasticsearch Authプラグインでアクセスコントロール
Elasticsearch AuthプラグインでアクセスコントロールShinsuke Sugaya
 
Aws×phpでの 高信頼かつハイパフォーマンスなシステム
Aws×phpでの 高信頼かつハイパフォーマンスなシステムAws×phpでの 高信頼かつハイパフォーマンスなシステム
Aws×phpでの 高信頼かつハイパフォーマンスなシステムKoteiIto
 
Fess/Elasticsearchを使った業務で使える?全文検索への道
Fess/Elasticsearchを使った業務で使える?全文検索への道Fess/Elasticsearchを使った業務で使える?全文検索への道
Fess/Elasticsearchを使った業務で使える?全文検索への道Shinsuke Sugaya
 
Mroongaを選んだ理由と
ちょっと嬉しかった話
Mroongaを選んだ理由と
ちょっと嬉しかった話Mroongaを選んだ理由と
ちょっと嬉しかった話
Mroongaを選んだ理由と
ちょっと嬉しかった話Terui Masashi
 
Elasticsearchで作る形態素解析サーバ
Elasticsearchで作る形態素解析サーバElasticsearchで作る形態素解析サーバ
Elasticsearchで作る形態素解析サーバShinsuke Sugaya
 
Elasticsearchのサジェスト機能を使った話
Elasticsearchのサジェスト機能を使った話Elasticsearchのサジェスト機能を使った話
Elasticsearchのサジェスト機能を使った話ktaro_w
 
Strata + Hadoop World 2014 レポート #cwt2014
Strata + Hadoop World 2014 レポート #cwt2014Strata + Hadoop World 2014 レポート #cwt2014
Strata + Hadoop World 2014 レポート #cwt2014Cloudera Japan
 
JavaScriptから利用するFirebase
JavaScriptから利用するFirebaseJavaScriptから利用するFirebase
JavaScriptから利用するFirebaseTakuji Shimokawa
 
ニコニコニュースと全文検索
ニコニコニュースと全文検索ニコニコニュースと全文検索
ニコニコニュースと全文検索techtalkdwango
 
トレジャーデータ 導入体験記 リブセンス編
トレジャーデータ 導入体験記 リブセンス編トレジャーデータ 導入体験記 リブセンス編
トレジャーデータ 導入体験記 リブセンス編Kentaro Yoshida
 

What's hot (20)

Elasticsearch 変わり種プラグインの作り方
Elasticsearch 変わり種プラグインの作り方Elasticsearch 変わり種プラグインの作り方
Elasticsearch 変わり種プラグインの作り方
 
Elasticsearch at Makuake
Elasticsearch at MakuakeElasticsearch at Makuake
Elasticsearch at Makuake
 
ElasticSearch+Kibanaでログデータの検索と視覚化を実現するテクニックと運用ノウハウ
ElasticSearch+Kibanaでログデータの検索と視覚化を実現するテクニックと運用ノウハウElasticSearch+Kibanaでログデータの検索と視覚化を実現するテクニックと運用ノウハウ
ElasticSearch+Kibanaでログデータの検索と視覚化を実現するテクニックと運用ノウハウ
 
いろいろ考えると日本語の全文検索もMySQLがいいね!
いろいろ考えると日本語の全文検索もMySQLがいいね!いろいろ考えると日本語の全文検索もMySQLがいいね!
いろいろ考えると日本語の全文検索もMySQLがいいね!
 
みんな大好き“全文検索 on AWS”を試してみました!
みんな大好き“全文検索 on AWS”を試してみました!みんな大好き“全文検索 on AWS”を試してみました!
みんな大好き“全文検索 on AWS”を試してみました!
 
MySQLユーザ視点での小さく始めるElasticsearch
MySQLユーザ視点での小さく始めるElasticsearchMySQLユーザ視点での小さく始めるElasticsearch
MySQLユーザ視点での小さく始めるElasticsearch
 
CAジャーナルクラブ Dremel: Interactive Analysis of Web-Scale Datasets
CAジャーナルクラブ Dremel: Interactive Analysis of Web-Scale DatasetsCAジャーナルクラブ Dremel: Interactive Analysis of Web-Scale Datasets
CAジャーナルクラブ Dremel: Interactive Analysis of Web-Scale Datasets
 
SolrとElasticsearchを比べてみよう
SolrとElasticsearchを比べてみようSolrとElasticsearchを比べてみよう
SolrとElasticsearchを比べてみよう
 
My sqlで2億件のシリアルデータと格闘した話
My sqlで2億件のシリアルデータと格闘した話My sqlで2億件のシリアルデータと格闘した話
My sqlで2億件のシリアルデータと格闘した話
 
Azure サービスを活用して作るフルマネージドな全文検索アプリケーション
Azure サービスを活用して作るフルマネージドな全文検索アプリケーションAzure サービスを活用して作るフルマネージドな全文検索アプリケーション
Azure サービスを活用して作るフルマネージドな全文検索アプリケーション
 
Elasticsearch Authプラグインでアクセスコントロール
Elasticsearch AuthプラグインでアクセスコントロールElasticsearch Authプラグインでアクセスコントロール
Elasticsearch Authプラグインでアクセスコントロール
 
Aws×phpでの 高信頼かつハイパフォーマンスなシステム
Aws×phpでの 高信頼かつハイパフォーマンスなシステムAws×phpでの 高信頼かつハイパフォーマンスなシステム
Aws×phpでの 高信頼かつハイパフォーマンスなシステム
 
Fess/Elasticsearchを使った業務で使える?全文検索への道
Fess/Elasticsearchを使った業務で使える?全文検索への道Fess/Elasticsearchを使った業務で使える?全文検索への道
Fess/Elasticsearchを使った業務で使える?全文検索への道
 
Mroongaを選んだ理由と
ちょっと嬉しかった話
Mroongaを選んだ理由と
ちょっと嬉しかった話Mroongaを選んだ理由と
ちょっと嬉しかった話
Mroongaを選んだ理由と
ちょっと嬉しかった話
 
Elasticsearchで作る形態素解析サーバ
Elasticsearchで作る形態素解析サーバElasticsearchで作る形態素解析サーバ
Elasticsearchで作る形態素解析サーバ
 
Elasticsearchのサジェスト機能を使った話
Elasticsearchのサジェスト機能を使った話Elasticsearchのサジェスト機能を使った話
Elasticsearchのサジェスト機能を使った話
 
Strata + Hadoop World 2014 レポート #cwt2014
Strata + Hadoop World 2014 レポート #cwt2014Strata + Hadoop World 2014 レポート #cwt2014
Strata + Hadoop World 2014 レポート #cwt2014
 
JavaScriptから利用するFirebase
JavaScriptから利用するFirebaseJavaScriptから利用するFirebase
JavaScriptから利用するFirebase
 
ニコニコニュースと全文検索
ニコニコニュースと全文検索ニコニコニュースと全文検索
ニコニコニュースと全文検索
 
トレジャーデータ 導入体験記 リブセンス編
トレジャーデータ 導入体験記 リブセンス編トレジャーデータ 導入体験記 リブセンス編
トレジャーデータ 導入体験記 リブセンス編
 

Viewers also liked

Elasticsearchを用いたはてなブックマークのトピック生成
Elasticsearchを用いたはてなブックマークのトピック生成Elasticsearchを用いたはてなブックマークのトピック生成
Elasticsearchを用いたはてなブックマークのトピック生成Shunsuke Kozawa
 
はてなブックマークのトピックページの裏側 in YAPC::Asia Tokyo 2015
はてなブックマークのトピックページの裏側 in YAPC::Asia Tokyo 2015はてなブックマークのトピックページの裏側 in YAPC::Asia Tokyo 2015
はてなブックマークのトピックページの裏側 in YAPC::Asia Tokyo 2015Shunsuke Kozawa
 
ElasticSearchでいろいろやってる話
ElasticSearchでいろいろやってる話ElasticSearchでいろいろやってる話
ElasticSearchでいろいろやってる話Shinya Takara
 
elasticsearchプラグイン入門
elasticsearchプラグイン入門elasticsearchプラグイン入門
elasticsearchプラグイン入門Shinsuke Sugaya
 
検索のダウンタイム0でバックアップからindexをリストアする方法
検索のダウンタイム0でバックアップからindexをリストアする方法検索のダウンタイム0でバックアップからindexをリストアする方法
検索のダウンタイム0でバックアップからindexをリストアする方法kbigwheel
 
Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見 前半(15分): SPIAS のご紹介と主な課題
Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見 前半(15分): SPIAS のご紹介と主な課題Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見 前半(15分): SPIAS のご紹介と主な課題
Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見 前半(15分): SPIAS のご紹介と主な課題Yasushi Hara
 
全文検索サーバ Fess 〜 全文検索システム構築時の悩みどころ
全文検索サーバ Fess 〜 全文検索システム構築時の悩みどころ全文検索サーバ Fess 〜 全文検索システム構築時の悩みどころ
全文検索サーバ Fess 〜 全文検索システム構築時の悩みどころShinsuke Sugaya
 

Viewers also liked (7)

Elasticsearchを用いたはてなブックマークのトピック生成
Elasticsearchを用いたはてなブックマークのトピック生成Elasticsearchを用いたはてなブックマークのトピック生成
Elasticsearchを用いたはてなブックマークのトピック生成
 
はてなブックマークのトピックページの裏側 in YAPC::Asia Tokyo 2015
はてなブックマークのトピックページの裏側 in YAPC::Asia Tokyo 2015はてなブックマークのトピックページの裏側 in YAPC::Asia Tokyo 2015
はてなブックマークのトピックページの裏側 in YAPC::Asia Tokyo 2015
 
ElasticSearchでいろいろやってる話
ElasticSearchでいろいろやってる話ElasticSearchでいろいろやってる話
ElasticSearchでいろいろやってる話
 
elasticsearchプラグイン入門
elasticsearchプラグイン入門elasticsearchプラグイン入門
elasticsearchプラグイン入門
 
検索のダウンタイム0でバックアップからindexをリストアする方法
検索のダウンタイム0でバックアップからindexをリストアする方法検索のダウンタイム0でバックアップからindexをリストアする方法
検索のダウンタイム0でバックアップからindexをリストアする方法
 
Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見 前半(15分): SPIAS のご紹介と主な課題
Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見 前半(15分): SPIAS のご紹介と主な課題Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見 前半(15分): SPIAS のご紹介と主な課題
Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見 前半(15分): SPIAS のご紹介と主な課題
 
全文検索サーバ Fess 〜 全文検索システム構築時の悩みどころ
全文検索サーバ Fess 〜 全文検索システム構築時の悩みどころ全文検索サーバ Fess 〜 全文検索システム構築時の悩みどころ
全文検索サーバ Fess 〜 全文検索システム構築時の悩みどころ
 

Similar to はてなブックマークに基づく関連記事レコメンドエンジンの開発

Api結合部の自動テスト方式
Api結合部の自動テスト方式 Api結合部の自動テスト方式
Api結合部の自動テスト方式 Daiki Kanai
 
blogサービスの全文検索の話 - #groonga を囲む夕べ
blogサービスの全文検索の話 - #groonga を囲む夕べblogサービスの全文検索の話 - #groonga を囲む夕べ
blogサービスの全文検索の話 - #groonga を囲む夕べMasahiro Nagano
 
脱コピペ!デザイナーにもわかるPHPとWP_Query
脱コピペ!デザイナーにもわかるPHPとWP_Query脱コピペ!デザイナーにもわかるPHPとWP_Query
脱コピペ!デザイナーにもわかるPHPとWP_QueryHidekazu Ishikawa
 
SeleniumE2Eテストフレームワークを使用したテスト自動化事例 #Seleniumjp
SeleniumE2Eテストフレームワークを使用したテスト自動化事例 #SeleniumjpSeleniumE2Eテストフレームワークを使用したテスト自動化事例 #Seleniumjp
SeleniumE2Eテストフレームワークを使用したテスト自動化事例 #SeleniumjpYahoo!デベロッパーネットワーク
 
【JaSST'14 Tokyo】システムテストの自動化による 大規模分散検索プラットフォームの 開発工程改善 #JaSST
【JaSST'14 Tokyo】システムテストの自動化による 大規模分散検索プラットフォームの 開発工程改善 #JaSST【JaSST'14 Tokyo】システムテストの自動化による 大規模分散検索プラットフォームの 開発工程改善 #JaSST
【JaSST'14 Tokyo】システムテストの自動化による 大規模分散検索プラットフォームの 開発工程改善 #JaSSTKotaro Ogino
 
ASP.NET シングル ページ アプリケーション (SPA) 詳説
ASP.NET シングル ページ アプリケーション (SPA) 詳説ASP.NET シングル ページ アプリケーション (SPA) 詳説
ASP.NET シングル ページ アプリケーション (SPA) 詳説Akira Inoue
 
TDDはじめる前に
TDDはじめる前にTDDはじめる前に
TDDはじめる前にYasui Tsutomu
 
タグ管理のススメ
タグ管理のススメタグ管理のススメ
タグ管理のススメMakoto Shimizu
 
Agile Japan 2018 サテライト<名古屋> 基調講演 補足資料
Agile Japan 2018 サテライト<名古屋> 基調講演 補足資料Agile Japan 2018 サテライト<名古屋> 基調講演 補足資料
Agile Japan 2018 サテライト<名古屋> 基調講演 補足資料You&I
 
自動テスト知識体系TABOKのご紹介
自動テスト知識体系TABOKのご紹介自動テスト知識体系TABOKのご紹介
自動テスト知識体系TABOKのご紹介Shinsuke Matsuki
 
第1回 Magento Cafe Plus Kansai ~ Magentoカスタマイズ入門
第1回 Magento Cafe Plus Kansai ~ Magentoカスタマイズ入門第1回 Magento Cafe Plus Kansai ~ Magentoカスタマイズ入門
第1回 Magento Cafe Plus Kansai ~ Magentoカスタマイズ入門Hirokazu Nishi
 
Django Rest Frameworkでお手軽にREST APIを作る
Django Rest Frameworkでお手軽にREST APIを作るDjango Rest Frameworkでお手軽にREST APIを作る
Django Rest Frameworkでお手軽にREST APIを作るMatsuo Keita
 
キーワード駆動によるシステムテストの自動化について 2015
キーワード駆動によるシステムテストの自動化について 2015キーワード駆動によるシステムテストの自動化について 2015
キーワード駆動によるシステムテストの自動化について 2015Toru Koido
 
Sansan における Android アプリ自動テスト導入事例
Sansan における Android アプリ自動テスト導入事例Sansan における Android アプリ自動テスト導入事例
Sansan における Android アプリ自動テスト導入事例健一 辰濱
 
【JaSST'18 Tokai】アジャイルとテスト自動化導入の勘所
【JaSST'18 Tokai】アジャイルとテスト自動化導入の勘所【JaSST'18 Tokai】アジャイルとテスト自動化導入の勘所
【JaSST'18 Tokai】アジャイルとテスト自動化導入の勘所Kotaro Ogino
 
最速で価値を提供する
最速で価値を提供する最速で価値を提供する
最速で価値を提供するLIFULL Co., Ltd.
 
テスト駆動インフラ構築-Chefとserverspecを使ったインフラ自動化のすすめ-
テスト駆動インフラ構築-Chefとserverspecを使ったインフラ自動化のすすめ-テスト駆動インフラ構築-Chefとserverspecを使ったインフラ自動化のすすめ-
テスト駆動インフラ構築-Chefとserverspecを使ったインフラ自動化のすすめ-賢 秋穂
 
Azure Api Management 俺的マニュアル 2020年3月版
Azure Api Management 俺的マニュアル 2020年3月版Azure Api Management 俺的マニュアル 2020年3月版
Azure Api Management 俺的マニュアル 2020年3月版貴志 上坂
 

Similar to はてなブックマークに基づく関連記事レコメンドエンジンの開発 (20)

Api結合部の自動テスト方式
Api結合部の自動テスト方式 Api結合部の自動テスト方式
Api結合部の自動テスト方式
 
blogサービスの全文検索の話 - #groonga を囲む夕べ
blogサービスの全文検索の話 - #groonga を囲む夕べblogサービスの全文検索の話 - #groonga を囲む夕べ
blogサービスの全文検索の話 - #groonga を囲む夕べ
 
脱コピペ!デザイナーにもわかるPHPとWP_Query
脱コピペ!デザイナーにもわかるPHPとWP_Query脱コピペ!デザイナーにもわかるPHPとWP_Query
脱コピペ!デザイナーにもわかるPHPとWP_Query
 
SeleniumE2Eテストフレームワークを使用したテスト自動化事例 #Seleniumjp
SeleniumE2Eテストフレームワークを使用したテスト自動化事例 #SeleniumjpSeleniumE2Eテストフレームワークを使用したテスト自動化事例 #Seleniumjp
SeleniumE2Eテストフレームワークを使用したテスト自動化事例 #Seleniumjp
 
2022-jasst-tohoku.pdf
2022-jasst-tohoku.pdf2022-jasst-tohoku.pdf
2022-jasst-tohoku.pdf
 
【JaSST'14 Tokyo】システムテストの自動化による 大規模分散検索プラットフォームの 開発工程改善 #JaSST
【JaSST'14 Tokyo】システムテストの自動化による 大規模分散検索プラットフォームの 開発工程改善 #JaSST【JaSST'14 Tokyo】システムテストの自動化による 大規模分散検索プラットフォームの 開発工程改善 #JaSST
【JaSST'14 Tokyo】システムテストの自動化による 大規模分散検索プラットフォームの 開発工程改善 #JaSST
 
ASP.NET シングル ページ アプリケーション (SPA) 詳説
ASP.NET シングル ページ アプリケーション (SPA) 詳説ASP.NET シングル ページ アプリケーション (SPA) 詳説
ASP.NET シングル ページ アプリケーション (SPA) 詳説
 
TDDはじめる前に
TDDはじめる前にTDDはじめる前に
TDDはじめる前に
 
タグ管理のススメ
タグ管理のススメタグ管理のススメ
タグ管理のススメ
 
Agile Japan 2018 サテライト<名古屋> 基調講演 補足資料
Agile Japan 2018 サテライト<名古屋> 基調講演 補足資料Agile Japan 2018 サテライト<名古屋> 基調講演 補足資料
Agile Japan 2018 サテライト<名古屋> 基調講演 補足資料
 
自動テスト知識体系TABOKのご紹介
自動テスト知識体系TABOKのご紹介自動テスト知識体系TABOKのご紹介
自動テスト知識体系TABOKのご紹介
 
第1回 Magento Cafe Plus Kansai ~ Magentoカスタマイズ入門
第1回 Magento Cafe Plus Kansai ~ Magentoカスタマイズ入門第1回 Magento Cafe Plus Kansai ~ Magentoカスタマイズ入門
第1回 Magento Cafe Plus Kansai ~ Magentoカスタマイズ入門
 
Django Rest Frameworkでお手軽にREST APIを作る
Django Rest Frameworkでお手軽にREST APIを作るDjango Rest Frameworkでお手軽にREST APIを作る
Django Rest Frameworkでお手軽にREST APIを作る
 
キーワード駆動によるシステムテストの自動化について 2015
キーワード駆動によるシステムテストの自動化について 2015キーワード駆動によるシステムテストの自動化について 2015
キーワード駆動によるシステムテストの自動化について 2015
 
Sansan における Android アプリ自動テスト導入事例
Sansan における Android アプリ自動テスト導入事例Sansan における Android アプリ自動テスト導入事例
Sansan における Android アプリ自動テスト導入事例
 
【JaSST'18 Tokai】アジャイルとテスト自動化導入の勘所
【JaSST'18 Tokai】アジャイルとテスト自動化導入の勘所【JaSST'18 Tokai】アジャイルとテスト自動化導入の勘所
【JaSST'18 Tokai】アジャイルとテスト自動化導入の勘所
 
最速で価値を提供する
最速で価値を提供する最速で価値を提供する
最速で価値を提供する
 
テスト駆動インフラ構築-Chefとserverspecを使ったインフラ自動化のすすめ-
テスト駆動インフラ構築-Chefとserverspecを使ったインフラ自動化のすすめ-テスト駆動インフラ構築-Chefとserverspecを使ったインフラ自動化のすすめ-
テスト駆動インフラ構築-Chefとserverspecを使ったインフラ自動化のすすめ-
 
Azure Api Management 俺的マニュアル 2020年3月版
Azure Api Management 俺的マニュアル 2020年3月版Azure Api Management 俺的マニュアル 2020年3月版
Azure Api Management 俺的マニュアル 2020年3月版
 
Q te cc2
Q te cc2Q te cc2
Q te cc2
 

More from Shunsuke Kozawa

Gunosyにおけるパーソナライズシステム
GunosyにおけるパーソナライズシステムGunosyにおけるパーソナライズシステム
GunosyにおけるパーソナライズシステムShunsuke Kozawa
 
Gunosyにおける仮説検証とABテスト
Gunosyにおける仮説検証とABテストGunosyにおける仮説検証とABテスト
Gunosyにおける仮説検証とABテストShunsuke Kozawa
 
Elasticsearch in hatena bookmark
Elasticsearch in hatena bookmarkElasticsearch in hatena bookmark
Elasticsearch in hatena bookmarkShunsuke Kozawa
 
はてなブックマークの新機能における自然言語処理の活用
はてなブックマークの新機能における自然言語処理の活用はてなブックマークの新機能における自然言語処理の活用
はてなブックマークの新機能における自然言語処理の活用Shunsuke Kozawa
 
Heady news headline abstraction through event pattern clustering
Heady  news headline abstraction through event pattern clusteringHeady  news headline abstraction through event pattern clustering
Heady news headline abstraction through event pattern clusteringShunsuke Kozawa
 
Active learning with efficient feature weighting methods for improving data q...
Active learning with efficient feature weighting methods for improving data q...Active learning with efficient feature weighting methods for improving data q...
Active learning with efficient feature weighting methods for improving data q...Shunsuke Kozawa
 
Joint inference of named entity recognition and normalization for tweets
Joint inference of named entity recognition and normalization for tweetsJoint inference of named entity recognition and normalization for tweets
Joint inference of named entity recognition and normalization for tweetsShunsuke Kozawa
 
Topical keyphrase extraction from twitter
Topical keyphrase extraction from twitterTopical keyphrase extraction from twitter
Topical keyphrase extraction from twitterShunsuke Kozawa
 

More from Shunsuke Kozawa (8)

Gunosyにおけるパーソナライズシステム
GunosyにおけるパーソナライズシステムGunosyにおけるパーソナライズシステム
Gunosyにおけるパーソナライズシステム
 
Gunosyにおける仮説検証とABテスト
Gunosyにおける仮説検証とABテストGunosyにおける仮説検証とABテスト
Gunosyにおける仮説検証とABテスト
 
Elasticsearch in hatena bookmark
Elasticsearch in hatena bookmarkElasticsearch in hatena bookmark
Elasticsearch in hatena bookmark
 
はてなブックマークの新機能における自然言語処理の活用
はてなブックマークの新機能における自然言語処理の活用はてなブックマークの新機能における自然言語処理の活用
はてなブックマークの新機能における自然言語処理の活用
 
Heady news headline abstraction through event pattern clustering
Heady  news headline abstraction through event pattern clusteringHeady  news headline abstraction through event pattern clustering
Heady news headline abstraction through event pattern clustering
 
Active learning with efficient feature weighting methods for improving data q...
Active learning with efficient feature weighting methods for improving data q...Active learning with efficient feature weighting methods for improving data q...
Active learning with efficient feature weighting methods for improving data q...
 
Joint inference of named entity recognition and normalization for tweets
Joint inference of named entity recognition and normalization for tweetsJoint inference of named entity recognition and normalization for tweets
Joint inference of named entity recognition and normalization for tweets
 
Topical keyphrase extraction from twitter
Topical keyphrase extraction from twitterTopical keyphrase extraction from twitter
Topical keyphrase extraction from twitter
 

Recently uploaded

自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NTT DATA Technology & Innovation
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 

Recently uploaded (8)

自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 

はてなブックマークに基づく関連記事レコメンドエンジンの開発