SlideShare a Scribd company logo
1 of 44
Download to read offline
Search Solutions
on AWS
Name
• Eiji Shinohara / 篠原 英治
Social
• Twitter: @shinodogg
• Blog: https://shinodogg.com
AWS Solutions Architect
• Area of Depth
• AWS Search Services
• Digital Advertising Technology
AWSの検索サービス
• Amazon CloudSearch
• https://aws.amazon.com/jp/cloudsearch/
• Amazon Elasticsearch Service
• https://aws.amazon.com/jp/elasticsearch-service/
Amazon CloudSearch Amazon Elasticsearch Service
A9.com → The team joins AWS
• CloudSearch/Amazon ES の開発拠点はパロアルト
Amazon CloudSearch
• ⾃動拡張するフルマネージド検索サービス
• 2011 API
• A9が作ったプロプライエタリな検索エンジン
• Amazon.comで使っているもの
• 東京リージョンは対象外
• 2013 API
• on top of Apache Solr
• 多⾔語対応
• ⽇本語の形態素解析、n-gram、カスタム辞書にも対応
• 東京リージョンは2014年3⽉からサービス提供中
Amazon CloudSearch
• Auto Scaling / Auto Partitining
Auto Partitioning
Auto Scaling
Amazon Elasticsearch Service
• Elasticsearchのマネージドサービス
• AWSクラウド上で Elasticsearch を簡単に構築可能
• Elasticsearchの分散/スケーリング機能はクラウドと相性が良い
• インスタンスタイプと台数を選択するだけでプロビジョニング
• デフォルトでKibanaがインストールされる
• Management ConsoleにてURLをクリックするだけで直ぐ利⽤可能
• 使った分だけの従量課⾦
• ノードに利⽤するEC2の時間課⾦
• EBSボリュームを使った場合はEBSの料⾦
• 略称はAmazon ES
AWS Podcast
•Episode #145 | September 5, 2016
• Jon Handler: Principal Search Services Solutions Architect
• Elasticsearchとは?
• Elasticsearchのどういうところが良い?
• Amazon Elasticsearch Serviceとは?
• Eliminate undifferenciated heavy lifting
• Easy to manage, operate, and scale
• Security
• Monitoring
• Just a few clicks to deploy
AWS re:Invent 2016
• Real-Time Data Exploration and Analytics with
Amazon Elasticsearch Service and Kibana(BDM302)
https://www.youtube.com/watch?v=R40N9eZTaAA
AWS re:Invent 2016
• Real-Time Data Exploration and Analytics with
Amazon Elasticsearch Service and Kibana(BDM302)
• Apacheのログを使ってend-to-endでログ解析する⽅法を紹介
• Amazon Kinesis Firehoseを使ってAmazon ESクラスタにデータを
投⼊
• インスタンスタイプ, ストレージオプション, shard数, インデック
スのローテーション等のベスト・プラクティスを紹介
• Kibanaのセットアップおよびカスタムダッシュボードウィジェット
の作成⽅法
• Deep Dive: Elasticsearch Query DSLやcustom/ad-hocレポート
の⽣成⽅法の紹介 等
テラバイト級のログデータをどうしていますか?
今回のセッションでは以下のような構成をご紹介します
data source Amazon Kinesis Firehose Amazon Elasticsearch
Service
Kibana
123 4
Query DSL
5
構築したアウトプットのイメージ
Shard 1 Shard 2 Shard 3 Shard 4
index は document の集合。各ドキュメント
は分割された shard に配置されます
Documents
Index
ID ID ID ID ID ID ID ID ID ID ID ID ID ID ID ID
...
Indexing, compression
index のクラスタへのデプロイメント
• Index 1
– Shard 1
– Shard 2
– Shard 3
• Index 2
– Shard 1
– Shard 2
– Shard 3
Amazon ES cluster
1
2
3
1
2
3
1
2
3
1
2
3
Primary Replica
1
3
3
1
Instance 1,
Master
2
1
1
2
Instance 2
3
2
2
3
Instance 3
How many instances?
• index のサイズは、元の document の集合と同じになる
場合が多い ※トークナイズの⽅法等にもよる
• Indexを複製する場合は倍のサイズ
• ストレージのサイジング
• ローカルのエフェメラルディスク、もしくは、インス
タンスごとに512GBのAmazon Elastic Block
Store(EBS)を選択
• 例: 2TBの元データの⽬安
• 512GBのEBSでIndexを複製する場合は8インスタン
ス
• i2.2xlargeのインデックスタイプを選択する場合は
ローカルのエフェメラルディスクを使えば4ノードで
も事⾜りる → カジュアルな⽤途向き
dedicated master ノードがないクラスタ
Amazon ES cluster
1
3
3
1
Instance 1,
Master
2
1
1
2
Instance 2
3
2
2
3
Instance 3
dedicated masterノードのあるクラスタ
Amazon ES cluster
1
3
3
1
Instance 1
2
1
1
2
Instance 2
3
2
2
3
Instance 3Dedicated master nodes
Data nodes: queries and updates
Zone awareness を有効にした場合のクラスタ
Amazon ES cluster
1
3
Instance 1
2
1 2
Instance 2
3
2
1
Instance 3
Availability Zone 1 Availability Zone 2
2
1
Instance 4
3
3
Amazon ES クラスタ構築のベストプラクティス
• Data nodes の数 = 必要なストレージ量 / ノード毎のストレージ
• GP2 EBS volume の活⽤
• 本番環境には 3 dedicated master ノード
• Zone Awareness の有効化
Amazon Elasticsearch Service overview
Amazon Route
53
Elastic Load
Balancing
AWS
IAM
Amazon
CloudWatch
Elasticsearch API
AWS CloudTrail
Amazon Elasticsearch Service を使う利点
Easy to use
Open-source
compatible
Secure
Highly available
AWS integrated
Scalable
Kinesis Firehose
Kinesis Firehose overview
• Delivery Stream:
AWSのリソースを活⽤
• Destination:
Amazon Redshift
Amazon S3
Amazon ES
• Record:
レコードをストリームにプッシュ
設定したデスティネーションに
データをお届け
Kinesis Firehose の デリバリーアーキテクチャ
intermediate
Amazon S3 bucket
backup S3 bucket
source records
data source
source
records
Amazon
Elasticsearch
Service
Firehose
delivery stream
delivery
[Coming soon!]
Kinensis Firehose のデリバリーアーキテクチャ
with transformations
intermediate
Amazon S3
bucket
backup S3 bucket
source records
data source
source records
Amazon
Elasticsearch
Service
Firehose
delivery stream
transformed
records transformed
records
transformation failure
delivery failure
※指定したLambda Functionで変換
Kinesis Firehose features for ingest
Serverless scale Error handling S3 Backup
Kinesis Firehose stream の作成
Kinesis Firehose の ベストプラクティス
• レイテンシーとトータルなスループットのバランスでbuffer size
を決める
スループットを上げるには⼩さいbuffer sizeが有利だが、コン
カレンシーに注意が必要
• index をローテーションさせる
よくあるのは Daily でのローテーション
• デフォルトのストリームの制限
stream limits: 2,000 transactions/second
5,000 records/second, and 5 MB/second
template および data のアップロード
Shard数 = index サイズ / 各ノードのサイズ
index を作成する際にShard数を設定
It dependsであるし、議論があるところ
ではあるが”Less is more”
Write:
該当ShardのノードのCPUを使う
Read:
全てのShardのノードのCPUを使う
同時並⾏で複数のShardに多数の書き込
むを⾏う場合は、クラスタ全体のCPUリ
ソースを考慮すること
Amazon ES cluster
1
3
3
1
Instance 1,
Master
2
1
1
2
Instance 2
3
2
2
3
Instance 3
Mapping でデータのインデクシングをコントロール
• Kibanaを使った可視化
は”not_analyzed”なテキストで良い
例えば、IPアドレスはドットで分割する必要ない
• Mappingのテンプレートは_template
APIを使って定義
全ての新しいインデックスに適⽤される
• テンプレートはShard数の設定にも⽤
いる
0 delete 1,3,5
1 get 2,3,4,6
2 head 1,7,9
3 post 2,8
4 put 24
Index
Writer
Log データを検索ドキュメントに変換
d104.aa.net - - [01/Jul/1995:00:00:15 -0400] "GET /images/KSC-logosmall.gif
HTTP/1.0" 200 1204
{"status": 200, "ident": "-", "@timestamp": "1995-07-01T00:00:05", "request":
"/images/KSC-logosmall.gif HTTP/1.0", "auth": "-", "host": "d104.aa.net", "verb":
"GET", "time": "01/Jul/1995:00:00:15 -0400", "size": 1204}
send_data メソッド
Kinesis FirehoseへのLogデータ送信
Kinesis FirehoseへのLogデータ送信の
ベストプラクティス
• セッティング⽤にテンプレートを使う
• Shard数を設定する
• 1つのノードに1つのアクティブなshard
• 可視化のユースケースでは全てのフィールドは”not_analyzed“で良い
Analyze Apache Web Logs
Amazon ES aggregations
• Buckets – ドキュメントをグループ化する際の項⽬
• Metrics – 集計後のBucketsのデータ
Bucket: time
Metric:count
Kibanaで可視化する際のベストプラクティス
• フィールドが not_analyzed であること
• 可視化はbucketsおよびmetricsベース
• Data Histogramには最初に x-axis を選択
Run Elasticsearch in the AWS cloud with
Amazon Elasticsearch Service
Use Kinesis Firehose to ingest data simply
Kibana for monitoring, Elasticsearch
queries for deeper analysisAmazon
Elasticsearch
Service
Lucene/Solr Revolution 2016
• PlayStation and Lucene - Indexing 1M documents per second
Alexander Filipchik, Sony Interactive Entertainment
http://www.slideshare.net/lucidworks/playstation-and-lucene-indexing-1m-documents-per-
second-presented-by-alexander-filipchik-sony-interactive-entertainment
Lucene/Solr Revolution 2016
• SearchHub - LucidWorks Fusion: Solr & Spark
http://www.slideshare.net/lucidworks/searchhub-how-to-spend-your-summer-keeping-it-real-
presented-by-grant-ingersoll-lucidworks
Elastic{on} TOUR 東京2016
• Elasticsearch 5 / Kibana 5
• 2016年12⽉15⽇
• 私は抽選の結果、⾒送りで参加できない為、是⾮シェアやフィードバックを〜
https://www.elastic.co/jp/elasticon/tour/2016/tokyo
Search Solutions on AWS

More Related Content

What's hot

クラウド上のデータ活用デザインパターン
クラウド上のデータ活用デザインパターンクラウド上のデータ活用デザインパターン
クラウド上のデータ活用デザインパターンAmazon Web Services Japan
 
AWSでDockerを扱うためのベストプラクティス
AWSでDockerを扱うためのベストプラクティスAWSでDockerを扱うためのベストプラクティス
AWSでDockerを扱うためのベストプラクティスAmazon Web Services Japan
 
CodeCommit/CodeDeploy/CodePipeline サービスアップデート(2016年10月)
CodeCommit/CodeDeploy/CodePipeline サービスアップデート(2016年10月)CodeCommit/CodeDeploy/CodePipeline サービスアップデート(2016年10月)
CodeCommit/CodeDeploy/CodePipeline サービスアップデート(2016年10月)Amazon Web Services Japan
 
AWS Black Belt Tech シリーズ 2015 - Amazon Kinesis
AWS Black Belt Tech シリーズ 2015 - Amazon KinesisAWS Black Belt Tech シリーズ 2015 - Amazon Kinesis
AWS Black Belt Tech シリーズ 2015 - Amazon KinesisAmazon Web Services Japan
 
CloudFrontのリアルタイムログをKibanaで可視化しよう
CloudFrontのリアルタイムログをKibanaで可視化しようCloudFrontのリアルタイムログをKibanaで可視化しよう
CloudFrontのリアルタイムログをKibanaで可視化しようEiji KOMINAMI
 
ログ管理のベストプラクティス
ログ管理のベストプラクティスログ管理のベストプラクティス
ログ管理のベストプラクティスAkihiro Kuwano
 
EC2 Deep Dive at CTO Night&Day 2016
EC2 Deep Dive at CTO Night&Day 2016 EC2 Deep Dive at CTO Night&Day 2016
EC2 Deep Dive at CTO Night&Day 2016 Yasuhiro Matsuo
 
AWS Black Belt Online Seminar 2016 Amazon EMR
AWS Black Belt Online Seminar 2016 Amazon EMRAWS Black Belt Online Seminar 2016 Amazon EMR
AWS Black Belt Online Seminar 2016 Amazon EMRAmazon Web Services Japan
 
AWS Summit Chicago 2016発表のサービスアップデートまとめ
AWS Summit Chicago 2016発表のサービスアップデートまとめAWS Summit Chicago 2016発表のサービスアップデートまとめ
AWS Summit Chicago 2016発表のサービスアップデートまとめAmazon Web Services Japan
 
AWS Black Belt Techシリーズ AWS Data Pipeline
AWS Black Belt Techシリーズ  AWS Data PipelineAWS Black Belt Techシリーズ  AWS Data Pipeline
AWS Black Belt Techシリーズ AWS Data PipelineAmazon Web Services Japan
 
S3 -ほぼ週刊AWSマイスターシリーズ第2回-
S3 -ほぼ週刊AWSマイスターシリーズ第2回-S3 -ほぼ週刊AWSマイスターシリーズ第2回-
S3 -ほぼ週刊AWSマイスターシリーズ第2回-SORACOM, INC
 
AWS X-Rayによるアプリケーションの分析とデバッグ
AWS X-Rayによるアプリケーションの分析とデバッグAWS X-Rayによるアプリケーションの分析とデバッグ
AWS X-Rayによるアプリケーションの分析とデバッグAmazon Web Services Japan
 
[Aurora事例祭り]毎日新聞ニュースサイトをクラウド化 ~Amazon Aurora 導入事例紹介~
[Aurora事例祭り]毎日新聞ニュースサイトをクラウド化  ~Amazon Aurora 導入事例紹介~[Aurora事例祭り]毎日新聞ニュースサイトをクラウド化  ~Amazon Aurora 導入事例紹介~
[Aurora事例祭り]毎日新聞ニュースサイトをクラウド化 ~Amazon Aurora 導入事例紹介~Amazon Web Services Japan
 
AWS Lambdaによるデータ処理理の⾃自動化とコモディティ化
AWS Lambdaによるデータ処理理の⾃自動化とコモディティ化AWS Lambdaによるデータ処理理の⾃自動化とコモディティ化
AWS Lambdaによるデータ処理理の⾃自動化とコモディティ化Amazon Web Services Japan
 
20170418 aws black-belt-architecture_pattern_of_serverless
20170418 aws black-belt-architecture_pattern_of_serverless20170418 aws black-belt-architecture_pattern_of_serverless
20170418 aws black-belt-architecture_pattern_of_serverlessAmazon Web Services Japan
 
20180220 AWS Black Belt Online Seminar - Amazon Container Services
20180220 AWS Black Belt Online Seminar - Amazon Container Services20180220 AWS Black Belt Online Seminar - Amazon Container Services
20180220 AWS Black Belt Online Seminar - Amazon Container ServicesAmazon Web Services Japan
 
AWS Black Belt Online Seminar 2017 AWS Elastic Beanstalk
AWS Black Belt Online Seminar 2017 AWS Elastic BeanstalkAWS Black Belt Online Seminar 2017 AWS Elastic Beanstalk
AWS Black Belt Online Seminar 2017 AWS Elastic BeanstalkAmazon Web Services Japan
 
20190122 AWS Black Belt Online Seminar Amazon Redshift Update
20190122 AWS Black Belt Online Seminar Amazon Redshift Update20190122 AWS Black Belt Online Seminar Amazon Redshift Update
20190122 AWS Black Belt Online Seminar Amazon Redshift UpdateAmazon Web Services Japan
 

What's hot (20)

クラウド上のデータ活用デザインパターン
クラウド上のデータ活用デザインパターンクラウド上のデータ活用デザインパターン
クラウド上のデータ活用デザインパターン
 
Machine Learning on AWS
Machine Learning on AWS Machine Learning on AWS
Machine Learning on AWS
 
AWSでDockerを扱うためのベストプラクティス
AWSでDockerを扱うためのベストプラクティスAWSでDockerを扱うためのベストプラクティス
AWSでDockerを扱うためのベストプラクティス
 
CodeCommit/CodeDeploy/CodePipeline サービスアップデート(2016年10月)
CodeCommit/CodeDeploy/CodePipeline サービスアップデート(2016年10月)CodeCommit/CodeDeploy/CodePipeline サービスアップデート(2016年10月)
CodeCommit/CodeDeploy/CodePipeline サービスアップデート(2016年10月)
 
AWS Black Belt Tech シリーズ 2015 - Amazon Kinesis
AWS Black Belt Tech シリーズ 2015 - Amazon KinesisAWS Black Belt Tech シリーズ 2015 - Amazon Kinesis
AWS Black Belt Tech シリーズ 2015 - Amazon Kinesis
 
JAWS-UG Meets Windows (JAWS Days 2017)
JAWS-UG Meets Windows (JAWS Days 2017)JAWS-UG Meets Windows (JAWS Days 2017)
JAWS-UG Meets Windows (JAWS Days 2017)
 
CloudFrontのリアルタイムログをKibanaで可視化しよう
CloudFrontのリアルタイムログをKibanaで可視化しようCloudFrontのリアルタイムログをKibanaで可視化しよう
CloudFrontのリアルタイムログをKibanaで可視化しよう
 
ログ管理のベストプラクティス
ログ管理のベストプラクティスログ管理のベストプラクティス
ログ管理のベストプラクティス
 
EC2 Deep Dive at CTO Night&Day 2016
EC2 Deep Dive at CTO Night&Day 2016 EC2 Deep Dive at CTO Night&Day 2016
EC2 Deep Dive at CTO Night&Day 2016
 
AWS Black Belt Online Seminar 2016 Amazon EMR
AWS Black Belt Online Seminar 2016 Amazon EMRAWS Black Belt Online Seminar 2016 Amazon EMR
AWS Black Belt Online Seminar 2016 Amazon EMR
 
AWS Summit Chicago 2016発表のサービスアップデートまとめ
AWS Summit Chicago 2016発表のサービスアップデートまとめAWS Summit Chicago 2016発表のサービスアップデートまとめ
AWS Summit Chicago 2016発表のサービスアップデートまとめ
 
AWS Black Belt Techシリーズ AWS Data Pipeline
AWS Black Belt Techシリーズ  AWS Data PipelineAWS Black Belt Techシリーズ  AWS Data Pipeline
AWS Black Belt Techシリーズ AWS Data Pipeline
 
S3 -ほぼ週刊AWSマイスターシリーズ第2回-
S3 -ほぼ週刊AWSマイスターシリーズ第2回-S3 -ほぼ週刊AWSマイスターシリーズ第2回-
S3 -ほぼ週刊AWSマイスターシリーズ第2回-
 
AWS X-Rayによるアプリケーションの分析とデバッグ
AWS X-Rayによるアプリケーションの分析とデバッグAWS X-Rayによるアプリケーションの分析とデバッグ
AWS X-Rayによるアプリケーションの分析とデバッグ
 
[Aurora事例祭り]毎日新聞ニュースサイトをクラウド化 ~Amazon Aurora 導入事例紹介~
[Aurora事例祭り]毎日新聞ニュースサイトをクラウド化  ~Amazon Aurora 導入事例紹介~[Aurora事例祭り]毎日新聞ニュースサイトをクラウド化  ~Amazon Aurora 導入事例紹介~
[Aurora事例祭り]毎日新聞ニュースサイトをクラウド化 ~Amazon Aurora 導入事例紹介~
 
AWS Lambdaによるデータ処理理の⾃自動化とコモディティ化
AWS Lambdaによるデータ処理理の⾃自動化とコモディティ化AWS Lambdaによるデータ処理理の⾃自動化とコモディティ化
AWS Lambdaによるデータ処理理の⾃自動化とコモディティ化
 
20170418 aws black-belt-architecture_pattern_of_serverless
20170418 aws black-belt-architecture_pattern_of_serverless20170418 aws black-belt-architecture_pattern_of_serverless
20170418 aws black-belt-architecture_pattern_of_serverless
 
20180220 AWS Black Belt Online Seminar - Amazon Container Services
20180220 AWS Black Belt Online Seminar - Amazon Container Services20180220 AWS Black Belt Online Seminar - Amazon Container Services
20180220 AWS Black Belt Online Seminar - Amazon Container Services
 
AWS Black Belt Online Seminar 2017 AWS Elastic Beanstalk
AWS Black Belt Online Seminar 2017 AWS Elastic BeanstalkAWS Black Belt Online Seminar 2017 AWS Elastic Beanstalk
AWS Black Belt Online Seminar 2017 AWS Elastic Beanstalk
 
20190122 AWS Black Belt Online Seminar Amazon Redshift Update
20190122 AWS Black Belt Online Seminar Amazon Redshift Update20190122 AWS Black Belt Online Seminar Amazon Redshift Update
20190122 AWS Black Belt Online Seminar Amazon Redshift Update
 

Similar to Search Solutions on AWS

AWSアップデート2012.12.01(個人開発者向け)+Glacier
AWSアップデート2012.12.01(個人開発者向け)+GlacierAWSアップデート2012.12.01(個人開発者向け)+Glacier
AWSアップデート2012.12.01(個人開発者向け)+GlacierYasuhiro Araki, Ph.D
 
AWS Black Belt Online Seminar 2016 AWS CloudFormation
AWS Black Belt Online Seminar 2016 AWS CloudFormationAWS Black Belt Online Seminar 2016 AWS CloudFormation
AWS Black Belt Online Seminar 2016 AWS CloudFormationAmazon Web Services Japan
 
AWS re:Invent 2019 recap For Digital Native Business
AWS re:Invent 2019 recap For Digital Native BusinessAWS re:Invent 2019 recap For Digital Native Business
AWS re:Invent 2019 recap For Digital Native BusinessAmazon Web Services Japan
 
ソリューションセッション#3 ビッグデータの3つのVと4つのプロセスを支えるAWS活用法
ソリューションセッション#3 ビッグデータの3つのVと4つのプロセスを支えるAWS活用法 ソリューションセッション#3 ビッグデータの3つのVと4つのプロセスを支えるAWS活用法
ソリューションセッション#3 ビッグデータの3つのVと4つのプロセスを支えるAWS活用法 Amazon Web Services Japan
 
[Sumo Logic x AWS 共催セミナー_20190829] Sumo Logic on AWS -AWS を活用したログ分析とセキュリティモニ...
[Sumo Logic x AWS 共催セミナー_20190829] Sumo Logic on AWS  -AWS を活用したログ分析とセキュリティモニ...[Sumo Logic x AWS 共催セミナー_20190829] Sumo Logic on AWS  -AWS を活用したログ分析とセキュリティモニ...
[Sumo Logic x AWS 共催セミナー_20190829] Sumo Logic on AWS -AWS を活用したログ分析とセキュリティモニ...Takanori Ohba
 
第15回 Solr勉強会 #SolrJP Amazon CloudSearch Deep Dive
第15回 Solr勉強会 #SolrJP Amazon CloudSearch Deep Dive第15回 Solr勉強会 #SolrJP Amazon CloudSearch Deep Dive
第15回 Solr勉強会 #SolrJP Amazon CloudSearch Deep DiveAmazon Web Services Japan
 
AWS re:Invent2019 Overview & New Releases Summary for Game
AWS re:Invent2019 Overview &New Releases Summary for GameAWS re:Invent2019 Overview &New Releases Summary for Game
AWS re:Invent2019 Overview & New Releases Summary for GameAmazon Web Services Japan
 
Running Java Apps with Amazon EC2, AWS Elastic Beanstalk or Serverless
Running Java Apps with Amazon EC2, AWS Elastic Beanstalk or ServerlessRunning Java Apps with Amazon EC2, AWS Elastic Beanstalk or Serverless
Running Java Apps with Amazon EC2, AWS Elastic Beanstalk or ServerlessKeisuke Nishitani
 
AWSを用いたWebホスティング
AWSを用いたWebホスティングAWSを用いたWebホスティング
AWSを用いたWebホスティングSORACOM, INC
 
AWS Black Belt Online Seminar AWSサービスを利用したアプリケーション開発を始めよう
AWS Black Belt Online Seminar AWSサービスを利用したアプリケーション開発を始めようAWS Black Belt Online Seminar AWSサービスを利用したアプリケーション開発を始めよう
AWS Black Belt Online Seminar AWSサービスを利用したアプリケーション開発を始めようAmazon Web Services Japan
 
Scaling on AWS - Feb 2016
Scaling on AWS - Feb 2016Scaling on AWS - Feb 2016
Scaling on AWS - Feb 2016Eiji Shinohara
 
20121221 AWS re:Invent 凱旋報告
20121221 AWS re:Invent 凱旋報告20121221 AWS re:Invent 凱旋報告
20121221 AWS re:Invent 凱旋報告真吾 吉田
 
20140628 AWSの2014前半のアップデートまとめ
20140628 AWSの2014前半のアップデートまとめ20140628 AWSの2014前半のアップデートまとめ
20140628 AWSの2014前半のアップデートまとめYasuhiro Araki, Ph.D
 
AWS 資格試験対策講座
AWS 資格試験対策講座AWS 資格試験対策講座
AWS 資格試験対策講座Kameda Harunobu
 
アマゾンクラウドの真価
アマゾンクラウドの真価アマゾンクラウドの真価
アマゾンクラウドの真価kaminashi
 

Similar to Search Solutions on AWS (20)

AWSアップデート2012.12.01(個人開発者向け)+Glacier
AWSアップデート2012.12.01(個人開発者向け)+GlacierAWSアップデート2012.12.01(個人開発者向け)+Glacier
AWSアップデート2012.12.01(個人開発者向け)+Glacier
 
Aws update jawstokyo-public
Aws update jawstokyo-publicAws update jawstokyo-public
Aws update jawstokyo-public
 
AWS Search Services
AWS Search ServicesAWS Search Services
AWS Search Services
 
AWS Black Belt Online Seminar 2016 AWS CloudFormation
AWS Black Belt Online Seminar 2016 AWS CloudFormationAWS Black Belt Online Seminar 2016 AWS CloudFormation
AWS Black Belt Online Seminar 2016 AWS CloudFormation
 
AWS re:Invent 2019 recap For Digital Native Business
AWS re:Invent 2019 recap For Digital Native BusinessAWS re:Invent 2019 recap For Digital Native Business
AWS re:Invent 2019 recap For Digital Native Business
 
ソリューションセッション#3 ビッグデータの3つのVと4つのプロセスを支えるAWS活用法
ソリューションセッション#3 ビッグデータの3つのVと4つのプロセスを支えるAWS活用法 ソリューションセッション#3 ビッグデータの3つのVと4つのプロセスを支えるAWS活用法
ソリューションセッション#3 ビッグデータの3つのVと4つのプロセスを支えるAWS活用法
 
[Sumo Logic x AWS 共催セミナー_20190829] Sumo Logic on AWS -AWS を活用したログ分析とセキュリティモニ...
[Sumo Logic x AWS 共催セミナー_20190829] Sumo Logic on AWS  -AWS を活用したログ分析とセキュリティモニ...[Sumo Logic x AWS 共催セミナー_20190829] Sumo Logic on AWS  -AWS を活用したログ分析とセキュリティモニ...
[Sumo Logic x AWS 共催セミナー_20190829] Sumo Logic on AWS -AWS を活用したログ分析とセキュリティモニ...
 
第15回 Solr勉強会 #SolrJP Amazon CloudSearch Deep Dive
第15回 Solr勉強会 #SolrJP Amazon CloudSearch Deep Dive第15回 Solr勉強会 #SolrJP Amazon CloudSearch Deep Dive
第15回 Solr勉強会 #SolrJP Amazon CloudSearch Deep Dive
 
AWS re:Invent2019 Overview & New Releases Summary for Game
AWS re:Invent2019 Overview &New Releases Summary for GameAWS re:Invent2019 Overview &New Releases Summary for Game
AWS re:Invent2019 Overview & New Releases Summary for Game
 
Running Java Apps with Amazon EC2, AWS Elastic Beanstalk or Serverless
Running Java Apps with Amazon EC2, AWS Elastic Beanstalk or ServerlessRunning Java Apps with Amazon EC2, AWS Elastic Beanstalk or Serverless
Running Java Apps with Amazon EC2, AWS Elastic Beanstalk or Serverless
 
AWSを用いたWebホスティング
AWSを用いたWebホスティングAWSを用いたWebホスティング
AWSを用いたWebホスティング
 
JAWS DAYS 2015
JAWS DAYS 2015JAWS DAYS 2015
JAWS DAYS 2015
 
AWS Black Belt Online Seminar AWSサービスを利用したアプリケーション開発を始めよう
AWS Black Belt Online Seminar AWSサービスを利用したアプリケーション開発を始めようAWS Black Belt Online Seminar AWSサービスを利用したアプリケーション開発を始めよう
AWS Black Belt Online Seminar AWSサービスを利用したアプリケーション開発を始めよう
 
Scaling on AWS - Feb 2016
Scaling on AWS - Feb 2016Scaling on AWS - Feb 2016
Scaling on AWS - Feb 2016
 
20121221 AWS re:Invent 凱旋報告
20121221 AWS re:Invent 凱旋報告20121221 AWS re:Invent 凱旋報告
20121221 AWS re:Invent 凱旋報告
 
20140628 AWSの2014前半のアップデートまとめ
20140628 AWSの2014前半のアップデートまとめ20140628 AWSの2014前半のアップデートまとめ
20140628 AWSの2014前半のアップデートまとめ
 
AWS 資格試験対策講座
AWS 資格試験対策講座AWS 資格試験対策講座
AWS 資格試験対策講座
 
20170725 black belt_monitoring_on_aws
20170725 black belt_monitoring_on_aws20170725 black belt_monitoring_on_aws
20170725 black belt_monitoring_on_aws
 
AWS re:Mind for CTOs
AWS re:Mind for CTOsAWS re:Mind for CTOs
AWS re:Mind for CTOs
 
アマゾンクラウドの真価
アマゾンクラウドの真価アマゾンクラウドの真価
アマゾンクラウドの真価
 

More from Eiji Shinohara

Indexing with Algolia Ruby API Client
Indexing with Algolia Ruby API ClientIndexing with Algolia Ruby API Client
Indexing with Algolia Ruby API ClientEiji Shinohara
 
Getting Started Algolia with InstantSearch.js
Getting Started Algolia with InstantSearch.jsGetting Started Algolia with InstantSearch.js
Getting Started Algolia with InstantSearch.jsEiji Shinohara
 
Algolia introduction in Kanazawa - July 2019
Algolia introduction in Kanazawa - July 2019Algolia introduction in Kanazawa - July 2019
Algolia introduction in Kanazawa - July 2019Eiji Shinohara
 
Scalable and Cost Effective Systems Architecture on AWS
Scalable and Cost Effective Systems Architecture on AWSScalable and Cost Effective Systems Architecture on AWS
Scalable and Cost Effective Systems Architecture on AWSEiji Shinohara
 
Accelerating AdTech on AWS in Japan
Accelerating AdTech on AWS in JapanAccelerating AdTech on AWS in Japan
Accelerating AdTech on AWS in JapanEiji Shinohara
 
AWS Summit New York 2017 Keynote Recap
AWS Summit New York 2017 Keynote RecapAWS Summit New York 2017 Keynote Recap
AWS Summit New York 2017 Keynote RecapEiji Shinohara
 
#CTONight powered by AWS
#CTONight powered by AWS#CTONight powered by AWS
#CTONight powered by AWSEiji Shinohara
 
SolrCloud on Amazon ECS
SolrCloud on Amazon ECSSolrCloud on Amazon ECS
SolrCloud on Amazon ECSEiji Shinohara
 
AWS Summit San Francisco 2017 Werner Vogelsによる基調講演を徹底紹介
AWS Summit San Francisco 2017 Werner Vogelsによる基調講演を徹底紹介AWS Summit San Francisco 2017 Werner Vogelsによる基調講演を徹底紹介
AWS Summit San Francisco 2017 Werner Vogelsによる基調講演を徹底紹介Eiji Shinohara
 
Global AWS AdTech use-cases
Global AWS AdTech use-casesGlobal AWS AdTech use-cases
Global AWS AdTech use-casesEiji Shinohara
 
IVS CTO Night and Day Recap - #CTONight 2016 Winter
IVS CTO Night and Day Recap - #CTONight 2016 WinterIVS CTO Night and Day Recap - #CTONight 2016 Winter
IVS CTO Night and Day Recap - #CTONight 2016 WinterEiji Shinohara
 
Tips for getting the most out of AWS re:Invent IN ENGLISH
Tips for getting the most out of AWS re:Invent IN ENGLISHTips for getting the most out of AWS re:Invent IN ENGLISH
Tips for getting the most out of AWS re:Invent IN ENGLISHEiji Shinohara
 
検索技術の活用による広告配信Relevance向上
検索技術の活用による広告配信Relevance向上検索技術の活用による広告配信Relevance向上
検索技術の活用による広告配信Relevance向上Eiji Shinohara
 
エンジニアの為のAWS実践講座
エンジニアの為のAWS実践講座エンジニアの為のAWS実践講座
エンジニアの為のAWS実践講座Eiji Shinohara
 
AWS Summit New York 2016 Recap : AWS Application Load Balancer and Amazon ECS
AWS Summit New York 2016 Recap : AWS Application Load Balancer and Amazon ECSAWS Summit New York 2016 Recap : AWS Application Load Balancer and Amazon ECS
AWS Summit New York 2016 Recap : AWS Application Load Balancer and Amazon ECSEiji Shinohara
 
個人的にAmazon EMR5.0.0でSpark 2.0を使ってZeppelinでSQL集計してみる
個人的にAmazon EMR5.0.0でSpark 2.0を使ってZeppelinでSQL集計してみる個人的にAmazon EMR5.0.0でSpark 2.0を使ってZeppelinでSQL集計してみる
個人的にAmazon EMR5.0.0でSpark 2.0を使ってZeppelinでSQL集計してみるEiji Shinohara
 
Accelerating AdTech on AWS #AWSAdTechJP
Accelerating AdTech on AWS #AWSAdTechJPAccelerating AdTech on AWS #AWSAdTechJP
Accelerating AdTech on AWS #AWSAdTechJPEiji Shinohara
 
IVS CTO Night and Day Recap - #CTONight 2016 Spring
IVS CTO Night and Day Recap - #CTONight 2016 SpringIVS CTO Night and Day Recap - #CTONight 2016 Spring
IVS CTO Night and Day Recap - #CTONight 2016 SpringEiji Shinohara
 
Ad Tech on AWS - IVS CTO Night and Day Spring 2016
Ad Tech on AWS - IVS CTO Night and Day Spring 2016Ad Tech on AWS - IVS CTO Night and Day Spring 2016
Ad Tech on AWS - IVS CTO Night and Day Spring 2016Eiji Shinohara
 

More from Eiji Shinohara (20)

Indexing with Algolia Ruby API Client
Indexing with Algolia Ruby API ClientIndexing with Algolia Ruby API Client
Indexing with Algolia Ruby API Client
 
Getting Started Algolia with InstantSearch.js
Getting Started Algolia with InstantSearch.jsGetting Started Algolia with InstantSearch.js
Getting Started Algolia with InstantSearch.js
 
Algolia introduction in Kanazawa - July 2019
Algolia introduction in Kanazawa - July 2019Algolia introduction in Kanazawa - July 2019
Algolia introduction in Kanazawa - July 2019
 
Scalable and Cost Effective Systems Architecture on AWS
Scalable and Cost Effective Systems Architecture on AWSScalable and Cost Effective Systems Architecture on AWS
Scalable and Cost Effective Systems Architecture on AWS
 
#AWSAdTechJP
#AWSAdTechJP#AWSAdTechJP
#AWSAdTechJP
 
Accelerating AdTech on AWS in Japan
Accelerating AdTech on AWS in JapanAccelerating AdTech on AWS in Japan
Accelerating AdTech on AWS in Japan
 
AWS Summit New York 2017 Keynote Recap
AWS Summit New York 2017 Keynote RecapAWS Summit New York 2017 Keynote Recap
AWS Summit New York 2017 Keynote Recap
 
#CTONight powered by AWS
#CTONight powered by AWS#CTONight powered by AWS
#CTONight powered by AWS
 
SolrCloud on Amazon ECS
SolrCloud on Amazon ECSSolrCloud on Amazon ECS
SolrCloud on Amazon ECS
 
AWS Summit San Francisco 2017 Werner Vogelsによる基調講演を徹底紹介
AWS Summit San Francisco 2017 Werner Vogelsによる基調講演を徹底紹介AWS Summit San Francisco 2017 Werner Vogelsによる基調講演を徹底紹介
AWS Summit San Francisco 2017 Werner Vogelsによる基調講演を徹底紹介
 
Global AWS AdTech use-cases
Global AWS AdTech use-casesGlobal AWS AdTech use-cases
Global AWS AdTech use-cases
 
IVS CTO Night and Day Recap - #CTONight 2016 Winter
IVS CTO Night and Day Recap - #CTONight 2016 WinterIVS CTO Night and Day Recap - #CTONight 2016 Winter
IVS CTO Night and Day Recap - #CTONight 2016 Winter
 
Tips for getting the most out of AWS re:Invent IN ENGLISH
Tips for getting the most out of AWS re:Invent IN ENGLISHTips for getting the most out of AWS re:Invent IN ENGLISH
Tips for getting the most out of AWS re:Invent IN ENGLISH
 
検索技術の活用による広告配信Relevance向上
検索技術の活用による広告配信Relevance向上検索技術の活用による広告配信Relevance向上
検索技術の活用による広告配信Relevance向上
 
エンジニアの為のAWS実践講座
エンジニアの為のAWS実践講座エンジニアの為のAWS実践講座
エンジニアの為のAWS実践講座
 
AWS Summit New York 2016 Recap : AWS Application Load Balancer and Amazon ECS
AWS Summit New York 2016 Recap : AWS Application Load Balancer and Amazon ECSAWS Summit New York 2016 Recap : AWS Application Load Balancer and Amazon ECS
AWS Summit New York 2016 Recap : AWS Application Load Balancer and Amazon ECS
 
個人的にAmazon EMR5.0.0でSpark 2.0を使ってZeppelinでSQL集計してみる
個人的にAmazon EMR5.0.0でSpark 2.0を使ってZeppelinでSQL集計してみる個人的にAmazon EMR5.0.0でSpark 2.0を使ってZeppelinでSQL集計してみる
個人的にAmazon EMR5.0.0でSpark 2.0を使ってZeppelinでSQL集計してみる
 
Accelerating AdTech on AWS #AWSAdTechJP
Accelerating AdTech on AWS #AWSAdTechJPAccelerating AdTech on AWS #AWSAdTechJP
Accelerating AdTech on AWS #AWSAdTechJP
 
IVS CTO Night and Day Recap - #CTONight 2016 Spring
IVS CTO Night and Day Recap - #CTONight 2016 SpringIVS CTO Night and Day Recap - #CTONight 2016 Spring
IVS CTO Night and Day Recap - #CTONight 2016 Spring
 
Ad Tech on AWS - IVS CTO Night and Day Spring 2016
Ad Tech on AWS - IVS CTO Night and Day Spring 2016Ad Tech on AWS - IVS CTO Night and Day Spring 2016
Ad Tech on AWS - IVS CTO Night and Day Spring 2016
 

Recently uploaded

スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 

Recently uploaded (9)

スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 

Search Solutions on AWS

  • 2. Name • Eiji Shinohara / 篠原 英治 Social • Twitter: @shinodogg • Blog: https://shinodogg.com AWS Solutions Architect • Area of Depth • AWS Search Services • Digital Advertising Technology
  • 3. AWSの検索サービス • Amazon CloudSearch • https://aws.amazon.com/jp/cloudsearch/ • Amazon Elasticsearch Service • https://aws.amazon.com/jp/elasticsearch-service/ Amazon CloudSearch Amazon Elasticsearch Service
  • 4. A9.com → The team joins AWS • CloudSearch/Amazon ES の開発拠点はパロアルト
  • 5. Amazon CloudSearch • ⾃動拡張するフルマネージド検索サービス • 2011 API • A9が作ったプロプライエタリな検索エンジン • Amazon.comで使っているもの • 東京リージョンは対象外 • 2013 API • on top of Apache Solr • 多⾔語対応 • ⽇本語の形態素解析、n-gram、カスタム辞書にも対応 • 東京リージョンは2014年3⽉からサービス提供中
  • 6. Amazon CloudSearch • Auto Scaling / Auto Partitining Auto Partitioning Auto Scaling
  • 7. Amazon Elasticsearch Service • Elasticsearchのマネージドサービス • AWSクラウド上で Elasticsearch を簡単に構築可能 • Elasticsearchの分散/スケーリング機能はクラウドと相性が良い • インスタンスタイプと台数を選択するだけでプロビジョニング • デフォルトでKibanaがインストールされる • Management ConsoleにてURLをクリックするだけで直ぐ利⽤可能 • 使った分だけの従量課⾦ • ノードに利⽤するEC2の時間課⾦ • EBSボリュームを使った場合はEBSの料⾦ • 略称はAmazon ES
  • 8. AWS Podcast •Episode #145 | September 5, 2016 • Jon Handler: Principal Search Services Solutions Architect • Elasticsearchとは? • Elasticsearchのどういうところが良い? • Amazon Elasticsearch Serviceとは? • Eliminate undifferenciated heavy lifting • Easy to manage, operate, and scale • Security • Monitoring • Just a few clicks to deploy
  • 9. AWS re:Invent 2016 • Real-Time Data Exploration and Analytics with Amazon Elasticsearch Service and Kibana(BDM302) https://www.youtube.com/watch?v=R40N9eZTaAA
  • 10. AWS re:Invent 2016 • Real-Time Data Exploration and Analytics with Amazon Elasticsearch Service and Kibana(BDM302) • Apacheのログを使ってend-to-endでログ解析する⽅法を紹介 • Amazon Kinesis Firehoseを使ってAmazon ESクラスタにデータを 投⼊ • インスタンスタイプ, ストレージオプション, shard数, インデック スのローテーション等のベスト・プラクティスを紹介 • Kibanaのセットアップおよびカスタムダッシュボードウィジェット の作成⽅法 • Deep Dive: Elasticsearch Query DSLやcustom/ad-hocレポート の⽣成⽅法の紹介 等
  • 12. 今回のセッションでは以下のような構成をご紹介します data source Amazon Kinesis Firehose Amazon Elasticsearch Service Kibana 123 4 Query DSL 5
  • 14. Shard 1 Shard 2 Shard 3 Shard 4 index は document の集合。各ドキュメント は分割された shard に配置されます Documents Index ID ID ID ID ID ID ID ID ID ID ID ID ID ID ID ID ... Indexing, compression
  • 15. index のクラスタへのデプロイメント • Index 1 – Shard 1 – Shard 2 – Shard 3 • Index 2 – Shard 1 – Shard 2 – Shard 3 Amazon ES cluster 1 2 3 1 2 3 1 2 3 1 2 3 Primary Replica 1 3 3 1 Instance 1, Master 2 1 1 2 Instance 2 3 2 2 3 Instance 3
  • 16. How many instances? • index のサイズは、元の document の集合と同じになる 場合が多い ※トークナイズの⽅法等にもよる • Indexを複製する場合は倍のサイズ • ストレージのサイジング • ローカルのエフェメラルディスク、もしくは、インス タンスごとに512GBのAmazon Elastic Block Store(EBS)を選択 • 例: 2TBの元データの⽬安 • 512GBのEBSでIndexを複製する場合は8インスタン ス • i2.2xlargeのインデックスタイプを選択する場合は ローカルのエフェメラルディスクを使えば4ノードで も事⾜りる → カジュアルな⽤途向き
  • 17. dedicated master ノードがないクラスタ Amazon ES cluster 1 3 3 1 Instance 1, Master 2 1 1 2 Instance 2 3 2 2 3 Instance 3
  • 18. dedicated masterノードのあるクラスタ Amazon ES cluster 1 3 3 1 Instance 1 2 1 1 2 Instance 2 3 2 2 3 Instance 3Dedicated master nodes Data nodes: queries and updates
  • 19. Zone awareness を有効にした場合のクラスタ Amazon ES cluster 1 3 Instance 1 2 1 2 Instance 2 3 2 1 Instance 3 Availability Zone 1 Availability Zone 2 2 1 Instance 4 3 3
  • 20. Amazon ES クラスタ構築のベストプラクティス • Data nodes の数 = 必要なストレージ量 / ノード毎のストレージ • GP2 EBS volume の活⽤ • 本番環境には 3 dedicated master ノード • Zone Awareness の有効化
  • 21. Amazon Elasticsearch Service overview Amazon Route 53 Elastic Load Balancing AWS IAM Amazon CloudWatch Elasticsearch API AWS CloudTrail
  • 22. Amazon Elasticsearch Service を使う利点 Easy to use Open-source compatible Secure Highly available AWS integrated Scalable
  • 24. Kinesis Firehose overview • Delivery Stream: AWSのリソースを活⽤ • Destination: Amazon Redshift Amazon S3 Amazon ES • Record: レコードをストリームにプッシュ 設定したデスティネーションに データをお届け
  • 25. Kinesis Firehose の デリバリーアーキテクチャ intermediate Amazon S3 bucket backup S3 bucket source records data source source records Amazon Elasticsearch Service Firehose delivery stream delivery
  • 26. [Coming soon!] Kinensis Firehose のデリバリーアーキテクチャ with transformations intermediate Amazon S3 bucket backup S3 bucket source records data source source records Amazon Elasticsearch Service Firehose delivery stream transformed records transformed records transformation failure delivery failure ※指定したLambda Functionで変換
  • 27. Kinesis Firehose features for ingest Serverless scale Error handling S3 Backup
  • 29. Kinesis Firehose の ベストプラクティス • レイテンシーとトータルなスループットのバランスでbuffer size を決める スループットを上げるには⼩さいbuffer sizeが有利だが、コン カレンシーに注意が必要 • index をローテーションさせる よくあるのは Daily でのローテーション • デフォルトのストリームの制限 stream limits: 2,000 transactions/second 5,000 records/second, and 5 MB/second
  • 30. template および data のアップロード
  • 31. Shard数 = index サイズ / 各ノードのサイズ index を作成する際にShard数を設定 It dependsであるし、議論があるところ ではあるが”Less is more” Write: 該当ShardのノードのCPUを使う Read: 全てのShardのノードのCPUを使う 同時並⾏で複数のShardに多数の書き込 むを⾏う場合は、クラスタ全体のCPUリ ソースを考慮すること Amazon ES cluster 1 3 3 1 Instance 1, Master 2 1 1 2 Instance 2 3 2 2 3 Instance 3
  • 32. Mapping でデータのインデクシングをコントロール • Kibanaを使った可視化 は”not_analyzed”なテキストで良い 例えば、IPアドレスはドットで分割する必要ない • Mappingのテンプレートは_template APIを使って定義 全ての新しいインデックスに適⽤される • テンプレートはShard数の設定にも⽤ いる 0 delete 1,3,5 1 get 2,3,4,6 2 head 1,7,9 3 post 2,8 4 put 24 Index Writer
  • 33. Log データを検索ドキュメントに変換 d104.aa.net - - [01/Jul/1995:00:00:15 -0400] "GET /images/KSC-logosmall.gif HTTP/1.0" 200 1204 {"status": 200, "ident": "-", "@timestamp": "1995-07-01T00:00:05", "request": "/images/KSC-logosmall.gif HTTP/1.0", "auth": "-", "host": "d104.aa.net", "verb": "GET", "time": "01/Jul/1995:00:00:15 -0400", "size": 1204}
  • 36. Kinesis FirehoseへのLogデータ送信の ベストプラクティス • セッティング⽤にテンプレートを使う • Shard数を設定する • 1つのノードに1つのアクティブなshard • 可視化のユースケースでは全てのフィールドは”not_analyzed“で良い
  • 38. Amazon ES aggregations • Buckets – ドキュメントをグループ化する際の項⽬ • Metrics – 集計後のBucketsのデータ Bucket: time Metric:count
  • 39. Kibanaで可視化する際のベストプラクティス • フィールドが not_analyzed であること • 可視化はbucketsおよびmetricsベース • Data Histogramには最初に x-axis を選択
  • 40. Run Elasticsearch in the AWS cloud with Amazon Elasticsearch Service Use Kinesis Firehose to ingest data simply Kibana for monitoring, Elasticsearch queries for deeper analysisAmazon Elasticsearch Service
  • 41. Lucene/Solr Revolution 2016 • PlayStation and Lucene - Indexing 1M documents per second Alexander Filipchik, Sony Interactive Entertainment http://www.slideshare.net/lucidworks/playstation-and-lucene-indexing-1m-documents-per- second-presented-by-alexander-filipchik-sony-interactive-entertainment
  • 42. Lucene/Solr Revolution 2016 • SearchHub - LucidWorks Fusion: Solr & Spark http://www.slideshare.net/lucidworks/searchhub-how-to-spend-your-summer-keeping-it-real- presented-by-grant-ingersoll-lucidworks
  • 43. Elastic{on} TOUR 東京2016 • Elasticsearch 5 / Kibana 5 • 2016年12⽉15⽇ • 私は抽選の結果、⾒送りで参加できない為、是⾮シェアやフィードバックを〜 https://www.elastic.co/jp/elasticon/tour/2016/tokyo