More Related Content
Similar to Riak Search 2.0を使ったデータ集計
Similar to Riak Search 2.0を使ったデータ集計 (20)
Riak Search 2.0を使ったデータ集計
- 4. Riak
Search
2.0
• 元々Riak
1.xバージョンでは検索機能は存在
した
• しかしマルチバイト対応していない、機能が少
ないなどの問題があった
• 2.0からバックエンドにSolrを使うことによりマ
ルチバイト対応やStats
Componentなどの処
理が可能に
- 9. テストに利用したデータ
• データマイニングのコンテストで用いられた検
索連動型広告のログデータ
– hFps://www.kddcup2012.org/c/kddcup2012-‐
track2
– 各行にはclick数,imps数,広告ID,表示位置,広告主
ID,UserIDなどが含まれる
– 実験では一部のフィールドを利用
• {"click_i":0,"imps_i”
1,"adid_s":"20665700",
"advid_s":"34004”,"pos_i":1,"kwid_s":"20775"}
- 14. サーバを増やしたときの挙動
• Riakクラスタを3台=>6台に変更
• 増やしているときは多少のレスポンスの低下が見られた
• サーバを追加するときも追加の設定やシステムの停止が
一切なく、簡単なコマンドで追加可能
• 変更終了後各サーバの保持している文章量は半分に
– データが増えていったときもサーバ追加することによりシステム
の停止なく対応可能
• 応答速度は今使っているデータにおいてはそこまで変わら
なかった
– より大規模なデータで試験する必要がある
– 実際のところ2000万件程度であればMySQL1台でも扱える