SlideShare a Scribd company logo
1 of 18
Download to read offline
Solr at Yahoo! JAPAN 
ヤフー株式会社 大須賀稔 
2014/12/08 第15回Solr勉強会 #SolrJP 
Copyright 
(C) 
2014 
Yahoo 
Japan 
Corpora5on. 
All 
Rights 
Reserved.
ヤフー株式会社 
プロジェクトマネージャ・Solr黒帯 
Copyright 
(C) 
2014 
Yahoo 
Japan 
Corpora5on. 
All 
Rights 
Reserved. 
P.2 
自己紹介 
大須賀 稔 
(おおすか みのる) 
Apacheソフトウェア財団 
ManifoldCFコミッタ兼PMCメンバー 
Solrコントリビュータ 
共著: [改訂新版] Apache Solr入門 
https://www.flickr.com/photos/o_0/14086728048/sizes/l 
Some rights reserved by *_*
120以上 ※1 
624億 ※2 
2,800万 ※2 
ユーザーID: 
※1 Yahoo! JAPAN サービス一覧 http://services.yahoo.co.jp/ 
Copyright 
(C) 
2014 
Yahoo 
Japan 
Corpora5on. 
All 
Rights 
Reserved. 
P.3 
会社紹介 
サービス数: 
月間総PV: 
7,300万 ※2 
Daily UB: 
https://www.flickr.com/photos/joao_trindade/4562486583/sizes/l 
月間アクティブ 
Some rights reserved ※2 ヤフー株式会社 2014年度 第2四半期 決算説明会資料 http://ir.yahoo.co.jp/jp/archives/present/ by trindade.joao
以前の検索サービスの仕組み 
インタ 
フェースB 
インタ 
フェースC 
インデックス インデックス インデックス インデックス 
検索機能の 
二重開発 
ライブラリの 
バグに気付かない 
Copyright 
(C) 
2014 
Yahoo 
Japan 
Corpora5on. 
All 
Rights 
Reserved. 
P.4 
以前の検索サービスの仕組み 
サービスA 
インタ 
フェースA 
Y!J独自検索 
ライブラリ 
サービスB 
Y!J独自検索 
ライブラリ 
サービスC 
Y!J独自検索 
ライブラリ 
サービスD 
インタ 
フェースD 
Y!J独自検索 
ライブラリ 
ライブラリの 
バージョンが違う 
効率的な開発・運用ができないか検討
Copyright 
(C) 
2014 
Yahoo 
Japan 
Corpora5on. 
All 
Rights 
Reserved. 
P.5 
ABYSS 
ABYSSとは? 
https://www.flickr.com/photos/bg3photo/5082428505/sizes/l 
Some rights reserved by BG³Photo 
BOSS Search APIインスパイア
現在の検索サービスの仕組み 
サービスA サービスB サービスC サービスD 
Copyright 
(C) 
2014 
Yahoo 
Japan 
Corpora5on. 
All 
Rights 
Reserved. 
P.6 
現在の検索サービスの仕組み 
ABYSS 
Y!J独自検索 
ライブラリ
Copyright 
(C) 
2014 
Yahoo 
Japan 
Corpora5on. 
All 
Rights 
Reserved. 
P.7 
現在のアーキテクチャ 
現在のアーキテクチャ※3 
※3 新検索プラットフォーム「ABYSS」 
http://techblog.yahoo.co.jp/architecture/abyss/
運用・メンテナンスコスト 
ソフトウェアライフサイクル 
Copyright 
(C) 
2014 
Yahoo 
Japan 
Corpora5on. 
All 
Rights 
Reserved. 
P.8 
ABYSS再構築 
なぜ再構築するのか? 
https://www.flickr.com/photos/billjacobus1/122497422/sizes/l 
Some rights reserved by billjacobus1 
レガシーなアーキテクチャ 
検索エンジンのコモディティ化
Apacheソフトウェア財団管理下 
プラグインでの拡張が容易 
Copyright 
(C) 
2014 
Yahoo 
Japan 
Corpora5on. 
All 
Rights 
Reserved. 
P.9 
Solr 
なぜSolrなのか? 
https://www.flickr.com/photos/gsfc/5808204795/sizes/l 
Some rights reserved by NASA Goddard Photo and Video 
多くの稼働実績 
可用性・耐障害性
カスタマイズ可能な検索 
ログ可視化機能 
Copyright 
(C) 
2014 
Yahoo 
Japan 
Corpora5on. 
All 
Rights 
Reserved. 
P.10 
提供する機能 
提供する機能 
https://www.flickr.com/photos/basheertome/6785217165/sizes/l 
Some rights reserved by basheertome 
高可用性・耐障害性 
Webベースの管理コンソール
UserABYSS Administrator / ABYSS User 
Flume 
Copyright 
(C) 
2014 
Yahoo 
Japan 
Corpora5on. 
All 
Rights 
Reserved. 
P.11 
新アーキテクチャ 
OpenStack 
SolrCloud 
(Document Indexes) 
SolrCloud 
(Log Indexes) 
Feed/Search API Control API 
ZooKeeper 
Banana 
Admin UI 
新アーキテクチャ 
WebMA 
SPDY Protocol 
Support 
WebMA 
SPDY Protocol 
Support 
Front End Application 
Morphline 
Event 
Log
Yahoo! JAPAN独自の日本語形態素 
解析器 
一般ユーザーにもWeb APIで公開中 
http://developer.yahoo.co.jp/webapi/jlp/ma/v1/parse.html 
Copyright 
(C) 
2014 
Yahoo 
Japan 
Corpora5on. 
All 
Rights 
Reserved. 
P.12 
WebMA 
WebMAとは? 
https://www.flickr.com/photos/crdot/5510506796/sizes/l 
Some rights reserved by crdotx 
京都大学はどこですか? 
京都大学 は どこ です か? 
何処 
何所 
京都 
京都大 
大学 
学 
京大 
文章 
区切り 
類義語 
トークン
テスト環境 : SolrCloud(2シャード+レプリカ=4ノード) 
Virtual Server 2GHz 4CPU / 6GBメモリ / 120GB HDD 
データセット : Wikipedia (English) 
クエリセット : Wikipedia (English) 見出し語 
8万キーワード(3万ユニークキーワード) 
ツール : solrmeter (20QPS) 
Average Query Time (Latency) 
Copyright 
(C) 
2014 
Yahoo 
Japan 
Corpora5on. 
All 
Rights 
Reserved. 
P.13 
SPDYプロトコルサポート 
SPDYプロトコルサポート 
search 
Shard1 
Shard2 
update 
414 ms 
342 ms 
Solr 
https://www.flickr.com/photos/xavier33300/15236610911/sizes/l 
Some rights reserved by Grand Parc - Bordeaux, France 
HTTP 
HTTP 
SPDY 
Solr(Jetty9)+SPDY3 
17%の速度改善がみられた
Copyright 
(C) 
2014 
Yahoo 
Japan 
Corpora5on. 
All 
Rights 
Reserved. 
P.14 
今後の計画 
今後の計画 
https://www.flickr.com/photos/29198100@N00/2368267322/sizes/l 
Some rights reserved by gamillos 
オートスケールの実装 
独自検索エンジンの機能移植 
Query Parser 
Top-k Query Processing (WAND) 
Machine-Learned Ranking (MLR) 
etc. 
OSSコミュニティとの協力
Copyright 
(C) 
2014 
Yahoo 
Japan 
Corpora5on. 
All 
Rights 
Reserved. 
P.15 
OSSコミュニティとの協力 
OSSコミュニティとの協力 
WASHINGTON, DC 
NOVEMBER 11-14 
カンファレンスへ積極的に 
参加 
コミッターやユーザーとの 
ネットワーク構築 
コントリビューション
Copyright 
(C) 
2014 
Yahoo 
Japan 
Corpora5on. 
All 
Rights 
Reserved. 
P.16 
コントリビューション 
コントリビューション 
https://www.flickr.com/photos/sis/66422743/sizes/l 
Some rights reserved by Sister72
Copyright 
(C) 
2014 
Yahoo 
Japan 
Corpora5on. 
All 
Rights 
Reserved. 
P.17 
参考資料 
参考資料 
Yahoo! JAPAN サービス一覧 
http://services.yahoo.co.jp/ 
ヤフー株式会社 2014年度 第2四半期 決算説明会資料 
http://ir.yahoo.co.jp/jp/archives/present/ 
BOSS Search API – Yahoo Developer Network 
https://developer.yahoo.com/boss/search/ 
新検索プラットフォーム「ABYSS」 
http://techblog.yahoo.co.jp/architecture/abyss/ 
これがABYSSのすべてだ!! 
http://techblog.yahoo.co.jp/architecture/abyss_1/ 
テキスト解析:日本語形態素解析 
http://developer.yahoo.co.jp/webapi/jlp/ma/v1/parse.html 
The Chromium Projects - SPDY 
http://www.chromium.org/spdy 
To enable SPDY in a SolrCloud setup 
https://issues.apache.org/jira/browse/SOLR-6699 
Visualizing Logs Using Apache Solr 
http://www.slideshare.net/mosuka/visualizing-logs-using-apache-solr 
https://www.flickr.com/photos/spam/5086168739/sizes/l 
Some rights reserved by Smath.
Copyright 
(C) 
2014 
Yahoo 
Japan 
Corpora5on. 
All 
Rights 
Reserved. 
P.18 
ご清聴ありがとうございました

More Related Content

What's hot

「Terraform」と連携して自動構築を実現するシステムライフサイクル効率化支援OSS「Exastro IT Automation」のご紹介
「Terraform」と連携して自動構築を実現するシステムライフサイクル効率化支援OSS「Exastro IT Automation」のご紹介「Terraform」と連携して自動構築を実現するシステムライフサイクル効率化支援OSS「Exastro IT Automation」のご紹介
「Terraform」と連携して自動構築を実現するシステムライフサイクル効率化支援OSS「Exastro IT Automation」のご紹介
ssuser05b05e
 
[AWSマイスターシリーズ] Amazon ElastiCache
[AWSマイスターシリーズ] Amazon ElastiCache[AWSマイスターシリーズ] Amazon ElastiCache
[AWSマイスターシリーズ] Amazon ElastiCache
Amazon Web Services Japan
 

What's hot (20)

君はyarn.lockをコミットしているか?
君はyarn.lockをコミットしているか?君はyarn.lockをコミットしているか?
君はyarn.lockをコミットしているか?
 
Apache Solr 検索エンジン入門
Apache Solr 検索エンジン入門Apache Solr 検索エンジン入門
Apache Solr 検索エンジン入門
 
ストリーム処理を支えるキューイングシステムの選び方
ストリーム処理を支えるキューイングシステムの選び方ストリーム処理を支えるキューイングシステムの選び方
ストリーム処理を支えるキューイングシステムの選び方
 
IAM Roles Anywhereのない世界とある世界(2022年のAWSアップデートを振り返ろう ~Season 4~ 発表資料)
IAM Roles Anywhereのない世界とある世界(2022年のAWSアップデートを振り返ろう ~Season 4~ 発表資料)IAM Roles Anywhereのない世界とある世界(2022年のAWSアップデートを振り返ろう ~Season 4~ 発表資料)
IAM Roles Anywhereのない世界とある世界(2022年のAWSアップデートを振り返ろう ~Season 4~ 発表資料)
 
「Terraform」と連携して自動構築を実現するシステムライフサイクル効率化支援OSS「Exastro IT Automation」のご紹介
「Terraform」と連携して自動構築を実現するシステムライフサイクル効率化支援OSS「Exastro IT Automation」のご紹介「Terraform」と連携して自動構築を実現するシステムライフサイクル効率化支援OSS「Exastro IT Automation」のご紹介
「Terraform」と連携して自動構築を実現するシステムライフサイクル効率化支援OSS「Exastro IT Automation」のご紹介
 
分散トレーシングAWS:X-Rayとの上手い付き合い方
分散トレーシングAWS:X-Rayとの上手い付き合い方分散トレーシングAWS:X-Rayとの上手い付き合い方
分散トレーシングAWS:X-Rayとの上手い付き合い方
 
テスト文字列に「うんこ」と入れるな
テスト文字列に「うんこ」と入れるなテスト文字列に「うんこ」と入れるな
テスト文字列に「うんこ」と入れるな
 
アプリ開発で知っておきたい認証技術 - OAuth 1.0 + OAuth 2.0 + OpenID Connect -
アプリ開発で知っておきたい認証技術 - OAuth 1.0 + OAuth 2.0 + OpenID Connect -アプリ開発で知っておきたい認証技術 - OAuth 1.0 + OAuth 2.0 + OpenID Connect -
アプリ開発で知っておきたい認証技術 - OAuth 1.0 + OAuth 2.0 + OpenID Connect -
 
わたくし、やっぱりCDKを使いたいですわ〜CDK import編〜.pdf
わたくし、やっぱりCDKを使いたいですわ〜CDK import編〜.pdfわたくし、やっぱりCDKを使いたいですわ〜CDK import編〜.pdf
わたくし、やっぱりCDKを使いたいですわ〜CDK import編〜.pdf
 
AWSスポットインスタンスの真髄
AWSスポットインスタンスの真髄AWSスポットインスタンスの真髄
AWSスポットインスタンスの真髄
 
ソーシャルゲームのためのデータベース設計
ソーシャルゲームのためのデータベース設計ソーシャルゲームのためのデータベース設計
ソーシャルゲームのためのデータベース設計
 
各種データベースの特徴とパフォーマンス比較
各種データベースの特徴とパフォーマンス比較各種データベースの特徴とパフォーマンス比較
各種データベースの特徴とパフォーマンス比較
 
[AWSマイスターシリーズ] Amazon ElastiCache
[AWSマイスターシリーズ] Amazon ElastiCache[AWSマイスターシリーズ] Amazon ElastiCache
[AWSマイスターシリーズ] Amazon ElastiCache
 
Where狙いのキー、order by狙いのキー
Where狙いのキー、order by狙いのキーWhere狙いのキー、order by狙いのキー
Where狙いのキー、order by狙いのキー
 
Amazon EKS によるスマホゲームのバックエンド運用事例
Amazon EKS によるスマホゲームのバックエンド運用事例Amazon EKS によるスマホゲームのバックエンド運用事例
Amazon EKS によるスマホゲームのバックエンド運用事例
 
あなたのチームの「いい人」は機能していますか?
あなたのチームの「いい人」は機能していますか?あなたのチームの「いい人」は機能していますか?
あなたのチームの「いい人」は機能していますか?
 
大規模ソーシャルゲームを支える技術~PHP+MySQLを使った高負荷対策~
大規模ソーシャルゲームを支える技術~PHP+MySQLを使った高負荷対策~大規模ソーシャルゲームを支える技術~PHP+MySQLを使った高負荷対策~
大規模ソーシャルゲームを支える技術~PHP+MySQLを使った高負荷対策~
 
Proxy War
Proxy WarProxy War
Proxy War
 
GraphQLのsubscriptionで出来ること
GraphQLのsubscriptionで出来ることGraphQLのsubscriptionで出来ること
GraphQLのsubscriptionで出来ること
 
はじめての検索エンジン&Solr 第13回Solr勉強会
はじめての検索エンジン&Solr 第13回Solr勉強会はじめての検索エンジン&Solr 第13回Solr勉強会
はじめての検索エンジン&Solr 第13回Solr勉強会
 

Similar to 第15回Solr勉強会 - Solr at Yahoo! JAPAN #SolrJP

Similar to 第15回Solr勉強会 - Solr at Yahoo! JAPAN #SolrJP (20)

Apache Pulsarの近況 & meetup 北京の参加報告 @PulsarMeetupJapan_20190904
Apache Pulsarの近況 & meetup 北京の参加報告 @PulsarMeetupJapan_20190904Apache Pulsarの近況 & meetup 北京の参加報告 @PulsarMeetupJapan_20190904
Apache Pulsarの近況 & meetup 北京の参加報告 @PulsarMeetupJapan_20190904
 
Googleアシスタントアプリ実際のところ
Googleアシスタントアプリ実際のところ Googleアシスタントアプリ実際のところ
Googleアシスタントアプリ実際のところ
 
YJTC18 A-1 大規模サーバの戦略
YJTC18 A-1 大規模サーバの戦略YJTC18 A-1 大規模サーバの戦略
YJTC18 A-1 大規模サーバの戦略
 
技術勉強会(Solr入門編)
技術勉強会(Solr入門編)技術勉強会(Solr入門編)
技術勉強会(Solr入門編)
 
Apache Kafkaによるログ転送とパフォーマンスチューニング - Bonfire Backend #2 -
Apache Kafkaによるログ転送とパフォーマンスチューニング - Bonfire Backend #2 -Apache Kafkaによるログ転送とパフォーマンスチューニング - Bonfire Backend #2 -
Apache Kafkaによるログ転送とパフォーマンスチューニング - Bonfire Backend #2 -
 
NHNグループ合同勉強会 ライブドア片野
NHNグループ合同勉強会 ライブドア片野NHNグループ合同勉強会 ライブドア片野
NHNグループ合同勉強会 ライブドア片野
 
Keycloak入門
Keycloak入門Keycloak入門
Keycloak入門
 
JRuby on Rails
JRuby on RailsJRuby on Rails
JRuby on Rails
 
MBAAで覚えるDBREの大事なおしごと
MBAAで覚えるDBREの大事なおしごとMBAAで覚えるDBREの大事なおしごと
MBAAで覚えるDBREの大事なおしごと
 
PHPにおけるI/O多重化とyield
PHPにおけるI/O多重化とyieldPHPにおけるI/O多重化とyield
PHPにおけるI/O多重化とyield
 
JavaOne 2015 JDK Update (Jigsaw) #j1jp
JavaOne 2015 JDK Update (Jigsaw) #j1jpJavaOne 2015 JDK Update (Jigsaw) #j1jp
JavaOne 2015 JDK Update (Jigsaw) #j1jp
 
solr勉強会資料
solr勉強会資料solr勉強会資料
solr勉強会資料
 
JAWS-UG山形 AWSのきほん 2016/11/12
JAWS-UG山形 AWSのきほん 2016/11/12 JAWS-UG山形 AWSのきほん 2016/11/12
JAWS-UG山形 AWSのきほん 2016/11/12
 
Hadoop ~Yahoo! JAPANの活用について~
Hadoop ~Yahoo! JAPANの活用について~Hadoop ~Yahoo! JAPANの活用について~
Hadoop ~Yahoo! JAPANの活用について~
 
Enterprise Redmine
Enterprise RedmineEnterprise Redmine
Enterprise Redmine
 
SeleniumE2Eテストフレームワークを使用したテスト自動化事例 #Seleniumjp
SeleniumE2Eテストフレームワークを使用したテスト自動化事例 #SeleniumjpSeleniumE2Eテストフレームワークを使用したテスト自動化事例 #Seleniumjp
SeleniumE2Eテストフレームワークを使用したテスト自動化事例 #Seleniumjp
 
リアルタイム通信アプリはつくれる!『Red5 Media Server』の機能と事例のご紹介
リアルタイム通信アプリはつくれる!『Red5 Media Server』の機能と事例のご紹介リアルタイム通信アプリはつくれる!『Red5 Media Server』の機能と事例のご紹介
リアルタイム通信アプリはつくれる!『Red5 Media Server』の機能と事例のご紹介
 
大規模システムScrum実践 効果と課題 #rsgt2015
大規模システムScrum実践 効果と課題 #rsgt2015大規模システムScrum実践 効果と課題 #rsgt2015
大規模システムScrum実践 効果と課題 #rsgt2015
 
State of the art Stream Processing #hadoopreading
State of the art Stream Processing #hadoopreadingState of the art Stream Processing #hadoopreading
State of the art Stream Processing #hadoopreading
 
Elasticsearch勉強会
Elasticsearch勉強会Elasticsearch勉強会
Elasticsearch勉強会
 

More from Yahoo!デベロッパーネットワーク

More from Yahoo!デベロッパーネットワーク (20)

ゼロから始める転移学習
ゼロから始める転移学習ゼロから始める転移学習
ゼロから始める転移学習
 
継続的なモデルモニタリングを実現するKubernetes Operator
継続的なモデルモニタリングを実現するKubernetes Operator継続的なモデルモニタリングを実現するKubernetes Operator
継続的なモデルモニタリングを実現するKubernetes Operator
 
ヤフーでは開発迅速性と品質のバランスをどう取ってるか
ヤフーでは開発迅速性と品質のバランスをどう取ってるかヤフーでは開発迅速性と品質のバランスをどう取ってるか
ヤフーでは開発迅速性と品質のバランスをどう取ってるか
 
オンプレML基盤on Kubernetes パネルディスカッション
オンプレML基盤on Kubernetes パネルディスカッションオンプレML基盤on Kubernetes パネルディスカッション
オンプレML基盤on Kubernetes パネルディスカッション
 
LakeTahoe
LakeTahoeLakeTahoe
LakeTahoe
 
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
 
Persistent-memory-native Database High-availability Feature
Persistent-memory-native Database High-availability FeaturePersistent-memory-native Database High-availability Feature
Persistent-memory-native Database High-availability Feature
 
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
 
eコマースと実店舗の相互利益を目指したデザイン #yjtc
eコマースと実店舗の相互利益を目指したデザイン #yjtceコマースと実店舗の相互利益を目指したデザイン #yjtc
eコマースと実店舗の相互利益を目指したデザイン #yjtc
 
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtcヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
 
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtcYahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
 
ビッグデータから人々のムードを捉える #yjtc
ビッグデータから人々のムードを捉える #yjtcビッグデータから人々のムードを捉える #yjtc
ビッグデータから人々のムードを捉える #yjtc
 
サイエンス領域におけるMLOpsの取り組み #yjtc
サイエンス領域におけるMLOpsの取り組み #yjtcサイエンス領域におけるMLOpsの取り組み #yjtc
サイエンス領域におけるMLOpsの取り組み #yjtc
 
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtcヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
 
Yahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtc
Yahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtcYahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtc
Yahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtc
 
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
 
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtcPC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
 
モブデザインによる多職種チームのコミュニケーション改善 #yjtc
モブデザインによる多職種チームのコミュニケーション改善 #yjtcモブデザインによる多職種チームのコミュニケーション改善 #yjtc
モブデザインによる多職種チームのコミュニケーション改善 #yjtc
 
「新しいおうち探し」のためのAIアシスト検索 #yjtc
「新しいおうち探し」のためのAIアシスト検索 #yjtc「新しいおうち探し」のためのAIアシスト検索 #yjtc
「新しいおうち探し」のためのAIアシスト検索 #yjtc
 
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtcユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
 

Recently uploaded

Recently uploaded (12)

知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 

第15回Solr勉強会 - Solr at Yahoo! JAPAN #SolrJP

  • 1. Solr at Yahoo! JAPAN ヤフー株式会社 大須賀稔 2014/12/08 第15回Solr勉強会 #SolrJP Copyright (C) 2014 Yahoo Japan Corpora5on. All Rights Reserved.
  • 2. ヤフー株式会社 プロジェクトマネージャ・Solr黒帯 Copyright (C) 2014 Yahoo Japan Corpora5on. All Rights Reserved. P.2 自己紹介 大須賀 稔 (おおすか みのる) Apacheソフトウェア財団 ManifoldCFコミッタ兼PMCメンバー Solrコントリビュータ 共著: [改訂新版] Apache Solr入門 https://www.flickr.com/photos/o_0/14086728048/sizes/l Some rights reserved by *_*
  • 3. 120以上 ※1 624億 ※2 2,800万 ※2 ユーザーID: ※1 Yahoo! JAPAN サービス一覧 http://services.yahoo.co.jp/ Copyright (C) 2014 Yahoo Japan Corpora5on. All Rights Reserved. P.3 会社紹介 サービス数: 月間総PV: 7,300万 ※2 Daily UB: https://www.flickr.com/photos/joao_trindade/4562486583/sizes/l 月間アクティブ Some rights reserved ※2 ヤフー株式会社 2014年度 第2四半期 決算説明会資料 http://ir.yahoo.co.jp/jp/archives/present/ by trindade.joao
  • 4. 以前の検索サービスの仕組み インタ フェースB インタ フェースC インデックス インデックス インデックス インデックス 検索機能の 二重開発 ライブラリの バグに気付かない Copyright (C) 2014 Yahoo Japan Corpora5on. All Rights Reserved. P.4 以前の検索サービスの仕組み サービスA インタ フェースA Y!J独自検索 ライブラリ サービスB Y!J独自検索 ライブラリ サービスC Y!J独自検索 ライブラリ サービスD インタ フェースD Y!J独自検索 ライブラリ ライブラリの バージョンが違う 効率的な開発・運用ができないか検討
  • 5. Copyright (C) 2014 Yahoo Japan Corpora5on. All Rights Reserved. P.5 ABYSS ABYSSとは? https://www.flickr.com/photos/bg3photo/5082428505/sizes/l Some rights reserved by BG³Photo BOSS Search APIインスパイア
  • 6. 現在の検索サービスの仕組み サービスA サービスB サービスC サービスD Copyright (C) 2014 Yahoo Japan Corpora5on. All Rights Reserved. P.6 現在の検索サービスの仕組み ABYSS Y!J独自検索 ライブラリ
  • 7. Copyright (C) 2014 Yahoo Japan Corpora5on. All Rights Reserved. P.7 現在のアーキテクチャ 現在のアーキテクチャ※3 ※3 新検索プラットフォーム「ABYSS」 http://techblog.yahoo.co.jp/architecture/abyss/
  • 8. 運用・メンテナンスコスト ソフトウェアライフサイクル Copyright (C) 2014 Yahoo Japan Corpora5on. All Rights Reserved. P.8 ABYSS再構築 なぜ再構築するのか? https://www.flickr.com/photos/billjacobus1/122497422/sizes/l Some rights reserved by billjacobus1 レガシーなアーキテクチャ 検索エンジンのコモディティ化
  • 9. Apacheソフトウェア財団管理下 プラグインでの拡張が容易 Copyright (C) 2014 Yahoo Japan Corpora5on. All Rights Reserved. P.9 Solr なぜSolrなのか? https://www.flickr.com/photos/gsfc/5808204795/sizes/l Some rights reserved by NASA Goddard Photo and Video 多くの稼働実績 可用性・耐障害性
  • 10. カスタマイズ可能な検索 ログ可視化機能 Copyright (C) 2014 Yahoo Japan Corpora5on. All Rights Reserved. P.10 提供する機能 提供する機能 https://www.flickr.com/photos/basheertome/6785217165/sizes/l Some rights reserved by basheertome 高可用性・耐障害性 Webベースの管理コンソール
  • 11. UserABYSS Administrator / ABYSS User Flume Copyright (C) 2014 Yahoo Japan Corpora5on. All Rights Reserved. P.11 新アーキテクチャ OpenStack SolrCloud (Document Indexes) SolrCloud (Log Indexes) Feed/Search API Control API ZooKeeper Banana Admin UI 新アーキテクチャ WebMA SPDY Protocol Support WebMA SPDY Protocol Support Front End Application Morphline Event Log
  • 12. Yahoo! JAPAN独自の日本語形態素 解析器 一般ユーザーにもWeb APIで公開中 http://developer.yahoo.co.jp/webapi/jlp/ma/v1/parse.html Copyright (C) 2014 Yahoo Japan Corpora5on. All Rights Reserved. P.12 WebMA WebMAとは? https://www.flickr.com/photos/crdot/5510506796/sizes/l Some rights reserved by crdotx 京都大学はどこですか? 京都大学 は どこ です か? 何処 何所 京都 京都大 大学 学 京大 文章 区切り 類義語 トークン
  • 13. テスト環境 : SolrCloud(2シャード+レプリカ=4ノード) Virtual Server 2GHz 4CPU / 6GBメモリ / 120GB HDD データセット : Wikipedia (English) クエリセット : Wikipedia (English) 見出し語 8万キーワード(3万ユニークキーワード) ツール : solrmeter (20QPS) Average Query Time (Latency) Copyright (C) 2014 Yahoo Japan Corpora5on. All Rights Reserved. P.13 SPDYプロトコルサポート SPDYプロトコルサポート search Shard1 Shard2 update 414 ms 342 ms Solr https://www.flickr.com/photos/xavier33300/15236610911/sizes/l Some rights reserved by Grand Parc - Bordeaux, France HTTP HTTP SPDY Solr(Jetty9)+SPDY3 17%の速度改善がみられた
  • 14. Copyright (C) 2014 Yahoo Japan Corpora5on. All Rights Reserved. P.14 今後の計画 今後の計画 https://www.flickr.com/photos/29198100@N00/2368267322/sizes/l Some rights reserved by gamillos オートスケールの実装 独自検索エンジンの機能移植 Query Parser Top-k Query Processing (WAND) Machine-Learned Ranking (MLR) etc. OSSコミュニティとの協力
  • 15. Copyright (C) 2014 Yahoo Japan Corpora5on. All Rights Reserved. P.15 OSSコミュニティとの協力 OSSコミュニティとの協力 WASHINGTON, DC NOVEMBER 11-14 カンファレンスへ積極的に 参加 コミッターやユーザーとの ネットワーク構築 コントリビューション
  • 16. Copyright (C) 2014 Yahoo Japan Corpora5on. All Rights Reserved. P.16 コントリビューション コントリビューション https://www.flickr.com/photos/sis/66422743/sizes/l Some rights reserved by Sister72
  • 17. Copyright (C) 2014 Yahoo Japan Corpora5on. All Rights Reserved. P.17 参考資料 参考資料 Yahoo! JAPAN サービス一覧 http://services.yahoo.co.jp/ ヤフー株式会社 2014年度 第2四半期 決算説明会資料 http://ir.yahoo.co.jp/jp/archives/present/ BOSS Search API – Yahoo Developer Network https://developer.yahoo.com/boss/search/ 新検索プラットフォーム「ABYSS」 http://techblog.yahoo.co.jp/architecture/abyss/ これがABYSSのすべてだ!! http://techblog.yahoo.co.jp/architecture/abyss_1/ テキスト解析:日本語形態素解析 http://developer.yahoo.co.jp/webapi/jlp/ma/v1/parse.html The Chromium Projects - SPDY http://www.chromium.org/spdy To enable SPDY in a SolrCloud setup https://issues.apache.org/jira/browse/SOLR-6699 Visualizing Logs Using Apache Solr http://www.slideshare.net/mosuka/visualizing-logs-using-apache-solr https://www.flickr.com/photos/spam/5086168739/sizes/l Some rights reserved by Smath.
  • 18. Copyright (C) 2014 Yahoo Japan Corpora5on. All Rights Reserved. P.18 ご清聴ありがとうございました