SlideShare a Scribd company logo
1 of 16
Download to read offline
1Copyright © Acroquest Technology Co., Ltd. All rights reserved.
Elastic Stack7.6における
教師あり機械学習の紹介
Acroquest Technology株式会社
Senior Consultant / Elastic Certified Engineer
吉岡 洋 @Hirosh_Yoshioka
はじめに
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
1. 今日話すこと
①Anomaly Detectionの概要
②Data Frame Analyticsの概要 ← 教師あり機械学習はここ
2. 今日話さないこと
①機械学習のアルゴリズムや評価手法の詳細
目次
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
1. Elastic MLにおける2種類の機械学習機能
1-1. Anomaly Detection
1-2. Data Frame Analytics
2. デモ
2-1. 分類による不良品予測
自己紹介
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
⚫ 名前:吉岡 洋(よしおかひろし)
⚫ 所属:Acroquest Technology株式会社
(シニアコンサルタント)
⚫ 領域:全文検索/ビッグデータ分析/可視化
⚫ その他:
─Microsoft MVP for Powershell(2006~2010)
─「Windows PowerShell宣言!」(2007)
─IBM Certified Specialist
IBM SPSS Modeler Professional(2014~)
─Elastic Certified Engineer(2018~)
Acroquest Technology株式会社
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
1. 新横浜にあるITベンチャー
①Great Place To Work(R) Institute Japan実施
働きがいのある会社ランキング第1位(3回受賞)
2. 事業(データ活用ビジネス)
①Elastic Stack活用コンサルティングサービス
– 検証/設計/構築/運用支援など
– Elastic Certified Engineer:5名
②IoTデータ分析プラットフォーム
③機械学習/AI
1. Elastic MLにおける
2種類の機械学習機能
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
1-1. Anomaly Detection(Ver.5.5でGAリリース)
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
1. 特徴
①時系列データの異常検知
②教師なし機械学習
– 閾値判定で検知できない異常を
判定/検知可能
2. サポートする異常検知
①トレンド異常検知
– 特定の周期を持った時系列データが過去と異なる振る舞いをしている
②Population Analysis
– グループ内の特定の個体が他とは異なる挙動をしている
例)特定のIPアドレスからのアクセスだけ404レスポンスの数が多い
閾値判定だと
異常検知できない
1-1. Anomaly Detection(機能強化)
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
1. 分析プロセスの効率化
① Data Visualizer(v6.1)
② CSVファイルのインポート機能(v6.5)
③ Annotation(v6.6)
2. モデル精度の向上
① Calendar Management(学習対象除外日の設定、v6.2)
② Custom Rule(モデル更新条件/異常検知判定のルール制御、v6.4)
③ スコア計算アルゴリズムの改善(v6.5)
– パーティション毎のスコア正規化/マルチバケット分析
3. 将来予測
① Forecast(v6.1)
1-2. Data Frame Analytics(Ver.7.3~)
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
1. 特徴
① 非時系列データの様々な分析
② Elastic Stack単体で学習/推論が可能
– 学習:Data frame analytics APIまたはKibana UIで実施
– 推論:Ingest Node(Inference Processor)を利用する。(v7.6)
2. サポートする分析手法
No 分析タイプ 学習 推論 Version 備考
1 Outlier Detection(外れ値検知) なし ー v7.3
2 Regression(回帰) あり 可能 v7.4
3 Classification(分類) あり 可能 v7.5 二項分類にのみ対応
4 Language identification
(言語識別)
あり
(プリセット)
可能 V7.6 109言語に対応
1-2. Data Frame Analytics(ユースケース)
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
1. 教師あり機械学習はBusiness Analytics領域で有用
Regression
(回帰)
Classification
(分類)
Language identification
(言語識別)
[信用リスク分析→未払いリスク低減]
債務者データから格付けスコアモデルを作成。
[アプリユーザ解約予測→解約防止キャンペーン]
顧客動向データから解約予測モデルを作成。
[問い合わせ言語判定→アサイン効率化]
問い合わせ内容を言語判定。適切な担当者をアサイン。
1-2. Data Frame Analytics(処理の流れ)
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
④推論
新規
インデックス
②Reindex 学習データ
インデックス
②分析
モデル
学習データ
インデックス
学習データ
(検証データ)
①データ登録
Ingest Node
(Inference Processor)
テストデータ
③データ登録
※②は以下のAPI
・Create data frame analytics jobs API
・Start data frame analytics jobs API
学習データ
インデックス
(+分析結果)
2. デモ
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
2-1. 分類による不良品予測
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
1. デモデータ(製造/試験データ:1000件)
① p1~p12:12ステップある各製造過程での評価値
② result:製造後の負荷試験結果(NGは不良品)
2. 分類を利用して不良品を予測する
① 説明変数:p1~p12
② 目的変数:result
p1 p2 p3 p4 p5 p6 p7 p8 p9 p10 p11 p12 result
1 28 1 0 1 65 158 1 12 5 B A NG
1 41 1 0 0 197 479 4 6 11 B B OK
1 44 1 0 0 0 651 6 3 7 B C OK
1 50 1 0 1 189 454 5 6 10 B C OK
1 25 1 0 1 153 368 7 4 5 B B OK
2-1. 分類による不良品予測
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
1. 作成したモデルに対する推論のテスト(正解はNG)
POST _ingest/pipeline/_simulate
{
"pipeline": {
"processors": [
{
"inference": {
"model_id": "★model_id★",
"inference_config": {
"classification": {}
},
"field_mappings": {}
}
}
]
},
"docs": [
{
"_source": {
"p1" : 1,
"p2" : 28,
"p3" : 1,
"p4" : 0,
"p5" : 1,
"p6" : 65,
"p7" : 158,
"p8" : 1,
"p9" : 12,
"p10" : 5,
"p11" : "B",
"p12" : "A"
}
}
]
}
まとめ
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
1. Elastic MLには2種類の機械学習機能がある
①Anomaly Detection(教師なし機械学習)
②Data Frame Analytics(教師あり機械学習)
※一部例外あり(Outlier Detectionは教師なし)
2. v7.6から教師あり機械学習の推論をサポート
①Elastic Stack単体での学習/推論が可能
②Data Frame Analyticsが導入されたことで、
Business Analytics領域での活用が期待できる
ご清聴ありがとうございました。
Evolve the Earth with Emotion of Technology
Copyright © Acroquest Technology Co., Ltd. All rights reserved.

More Related Content

What's hot

Elasticsaerch Runtime Field
Elasticsaerch Runtime FieldElasticsaerch Runtime Field
Elasticsaerch Runtime FieldNomura Yuta
 
データ履歴管理のためのテンポラルデータモデルとReladomoの紹介 #jjug_ccc #ccc_g3
データ履歴管理のためのテンポラルデータモデルとReladomoの紹介 #jjug_ccc #ccc_g3 データ履歴管理のためのテンポラルデータモデルとReladomoの紹介 #jjug_ccc #ccc_g3
データ履歴管理のためのテンポラルデータモデルとReladomoの紹介 #jjug_ccc #ccc_g3 Hiroshi Ito
 
ビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionTetsutaro Watanabe
 
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版) データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版) Satoshi Nagayasu
 
アプリケーション開発者のためのAzure Databricks入門
アプリケーション開発者のためのAzure Databricks入門アプリケーション開発者のためのAzure Databricks入門
アプリケーション開発者のためのAzure Databricks入門Yoichi Kawasaki
 
第45回elasticsearch勉強会 BERTモデルを利用した文書分類
第45回elasticsearch勉強会 BERTモデルを利用した文書分類第45回elasticsearch勉強会 BERTモデルを利用した文書分類
第45回elasticsearch勉強会 BERTモデルを利用した文書分類shinhiguchi
 
Kubernetes 疲れに Azure Container Apps はいかがでしょうか?(江東区合同ライトニングトーク 発表資料)
Kubernetes 疲れに Azure Container Apps はいかがでしょうか?(江東区合同ライトニングトーク 発表資料)Kubernetes 疲れに Azure Container Apps はいかがでしょうか?(江東区合同ライトニングトーク 発表資料)
Kubernetes 疲れに Azure Container Apps はいかがでしょうか?(江東区合同ライトニングトーク 発表資料)NTT DATA Technology & Innovation
 
データモデリング・テクニック
データモデリング・テクニックデータモデリング・テクニック
データモデリング・テクニックHidekatsu Izuno
 
Where狙いのキー、order by狙いのキー
Where狙いのキー、order by狙いのキーWhere狙いのキー、order by狙いのキー
Where狙いのキー、order by狙いのキーyoku0825
 
エンジニアの個人ブランディングと技術組織
エンジニアの個人ブランディングと技術組織エンジニアの個人ブランディングと技術組織
エンジニアの個人ブランディングと技術組織Takafumi ONAKA
 
データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例Tetsutaro Watanabe
 
社内ドキュメント検索システム構築のノウハウ
社内ドキュメント検索システム構築のノウハウ社内ドキュメント検索システム構築のノウハウ
社内ドキュメント検索システム構築のノウハウShinsuke Sugaya
 
RDB技術者のためのNoSQLガイド NoSQLの必要性と位置づけ
RDB技術者のためのNoSQLガイド NoSQLの必要性と位置づけRDB技術者のためのNoSQLガイド NoSQLの必要性と位置づけ
RDB技術者のためのNoSQLガイド NoSQLの必要性と位置づけRecruit Technologies
 
SQLアンチパターン(インデックスショットガン)
SQLアンチパターン(インデックスショットガン)SQLアンチパターン(インデックスショットガン)
SQLアンチパターン(インデックスショットガン)Tomoaki Uchida
 
モノタロウの1900万商品を検索する Elasticsearch構築運用事例(2022-10-26 第50回Elasticsearch 勉強会発表資料)
モノタロウの1900万商品を検索する Elasticsearch構築運用事例(2022-10-26 第50回Elasticsearch 勉強会発表資料)モノタロウの1900万商品を検索する Elasticsearch構築運用事例(2022-10-26 第50回Elasticsearch 勉強会発表資料)
モノタロウの1900万商品を検索する Elasticsearch構築運用事例(2022-10-26 第50回Elasticsearch 勉強会発表資料)株式会社MonotaRO Tech Team
 
ビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分けビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分けRecruit Technologies
 
MySQL勉強会 クエリチューニング編
MySQL勉強会 クエリチューニング編MySQL勉強会 クエリチューニング編
MySQL勉強会 クエリチューニング編MicroAd, Inc.(Engineer)
 
[DI08] その情報うまく取り出せていますか? ~ 意外と簡単、Azure Search で短時間で検索精度と利便性を向上させるための方法
[DI08] その情報うまく取り出せていますか? ~ 意外と簡単、Azure Search で短時間で検索精度と利便性を向上させるための方法[DI08] その情報うまく取り出せていますか? ~ 意外と簡単、Azure Search で短時間で検索精度と利便性を向上させるための方法
[DI08] その情報うまく取り出せていますか? ~ 意外と簡単、Azure Search で短時間で検索精度と利便性を向上させるための方法de:code 2017
 
DDD 2016 DB 12c クエリー・オプティマイザ新機能活用と統計情報運用の戦略
DDD 2016 DB 12c クエリー・オプティマイザ新機能活用と統計情報運用の戦略DDD 2016 DB 12c クエリー・オプティマイザ新機能活用と統計情報運用の戦略
DDD 2016 DB 12c クエリー・オプティマイザ新機能活用と統計情報運用の戦略歩 柴田
 
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)Yosuke Katsuki
 

What's hot (20)

Elasticsaerch Runtime Field
Elasticsaerch Runtime FieldElasticsaerch Runtime Field
Elasticsaerch Runtime Field
 
データ履歴管理のためのテンポラルデータモデルとReladomoの紹介 #jjug_ccc #ccc_g3
データ履歴管理のためのテンポラルデータモデルとReladomoの紹介 #jjug_ccc #ccc_g3 データ履歴管理のためのテンポラルデータモデルとReladomoの紹介 #jjug_ccc #ccc_g3
データ履歴管理のためのテンポラルデータモデルとReladomoの紹介 #jjug_ccc #ccc_g3
 
ビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年version
 
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版) データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
 
アプリケーション開発者のためのAzure Databricks入門
アプリケーション開発者のためのAzure Databricks入門アプリケーション開発者のためのAzure Databricks入門
アプリケーション開発者のためのAzure Databricks入門
 
第45回elasticsearch勉強会 BERTモデルを利用した文書分類
第45回elasticsearch勉強会 BERTモデルを利用した文書分類第45回elasticsearch勉強会 BERTモデルを利用した文書分類
第45回elasticsearch勉強会 BERTモデルを利用した文書分類
 
Kubernetes 疲れに Azure Container Apps はいかがでしょうか?(江東区合同ライトニングトーク 発表資料)
Kubernetes 疲れに Azure Container Apps はいかがでしょうか?(江東区合同ライトニングトーク 発表資料)Kubernetes 疲れに Azure Container Apps はいかがでしょうか?(江東区合同ライトニングトーク 発表資料)
Kubernetes 疲れに Azure Container Apps はいかがでしょうか?(江東区合同ライトニングトーク 発表資料)
 
データモデリング・テクニック
データモデリング・テクニックデータモデリング・テクニック
データモデリング・テクニック
 
Where狙いのキー、order by狙いのキー
Where狙いのキー、order by狙いのキーWhere狙いのキー、order by狙いのキー
Where狙いのキー、order by狙いのキー
 
エンジニアの個人ブランディングと技術組織
エンジニアの個人ブランディングと技術組織エンジニアの個人ブランディングと技術組織
エンジニアの個人ブランディングと技術組織
 
データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例
 
社内ドキュメント検索システム構築のノウハウ
社内ドキュメント検索システム構築のノウハウ社内ドキュメント検索システム構築のノウハウ
社内ドキュメント検索システム構築のノウハウ
 
RDB技術者のためのNoSQLガイド NoSQLの必要性と位置づけ
RDB技術者のためのNoSQLガイド NoSQLの必要性と位置づけRDB技術者のためのNoSQLガイド NoSQLの必要性と位置づけ
RDB技術者のためのNoSQLガイド NoSQLの必要性と位置づけ
 
SQLアンチパターン(インデックスショットガン)
SQLアンチパターン(インデックスショットガン)SQLアンチパターン(インデックスショットガン)
SQLアンチパターン(インデックスショットガン)
 
モノタロウの1900万商品を検索する Elasticsearch構築運用事例(2022-10-26 第50回Elasticsearch 勉強会発表資料)
モノタロウの1900万商品を検索する Elasticsearch構築運用事例(2022-10-26 第50回Elasticsearch 勉強会発表資料)モノタロウの1900万商品を検索する Elasticsearch構築運用事例(2022-10-26 第50回Elasticsearch 勉強会発表資料)
モノタロウの1900万商品を検索する Elasticsearch構築運用事例(2022-10-26 第50回Elasticsearch 勉強会発表資料)
 
ビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分けビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分け
 
MySQL勉強会 クエリチューニング編
MySQL勉強会 クエリチューニング編MySQL勉強会 クエリチューニング編
MySQL勉強会 クエリチューニング編
 
[DI08] その情報うまく取り出せていますか? ~ 意外と簡単、Azure Search で短時間で検索精度と利便性を向上させるための方法
[DI08] その情報うまく取り出せていますか? ~ 意外と簡単、Azure Search で短時間で検索精度と利便性を向上させるための方法[DI08] その情報うまく取り出せていますか? ~ 意外と簡単、Azure Search で短時間で検索精度と利便性を向上させるための方法
[DI08] その情報うまく取り出せていますか? ~ 意外と簡単、Azure Search で短時間で検索精度と利便性を向上させるための方法
 
DDD 2016 DB 12c クエリー・オプティマイザ新機能活用と統計情報運用の戦略
DDD 2016 DB 12c クエリー・オプティマイザ新機能活用と統計情報運用の戦略DDD 2016 DB 12c クエリー・オプティマイザ新機能活用と統計情報運用の戦略
DDD 2016 DB 12c クエリー・オプティマイザ新機能活用と統計情報運用の戦略
 
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
 

Similar to Supervised Machine Learning of Elastic Stack

[db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ! by 株式会社日立製作所 村上順一
 [db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ!  by 株式会社日立製作所 村上順一 [db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ!  by 株式会社日立製作所 村上順一
[db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ! by 株式会社日立製作所 村上順一Insight Technology, Inc.
 
How to organize data science project (データサイエンスプロジェクトの始め方101)
How to organize data science project (データサイエンスプロジェクトの始め方101)How to organize data science project (データサイエンスプロジェクトの始め方101)
How to organize data science project (データサイエンスプロジェクトの始め方101)Yasuyuki Kataoka
 
Oracle Data Miner で始める簡単・高速な機械学習
Oracle Data Miner で始める簡単・高速な機械学習Oracle Data Miner で始める簡単・高速な機械学習
Oracle Data Miner で始める簡単・高速な機械学習Tamakoshi Hironori
 
A3RT - the details and actual use cases of "Analytics & Artificial intelligen...
A3RT - the details and actual use cases of "Analytics & Artificial intelligen...A3RT - the details and actual use cases of "Analytics & Artificial intelligen...
A3RT - the details and actual use cases of "Analytics & Artificial intelligen...DataWorks Summit/Hadoop Summit
 
A3RT -The details and actual use cases of“Analytics & Artificial intelligence...
A3RT -The details and actual use cases of“Analytics & Artificial intelligence...A3RT -The details and actual use cases of“Analytics & Artificial intelligence...
A3RT -The details and actual use cases of“Analytics & Artificial intelligence...Recruit Technologies
 
TERAS Conference
TERAS ConferenceTERAS Conference
TERAS ConferenceKeiju Anada
 
SIOS iQ:機械学習 I T O A VMware仮想環境の性能問題の原因分析 迅速な問題解決と未然防止を実現
SIOS iQ:機械学習 I T O A VMware仮想環境の性能問題の原因分析 迅速な問題解決と未然防止を実現SIOS iQ:機械学習 I T O A VMware仮想環境の性能問題の原因分析 迅速な問題解決と未然防止を実現
SIOS iQ:機械学習 I T O A VMware仮想環境の性能問題の原因分析 迅速な問題解決と未然防止を実現softlayerjp
 
Redmineの情報を自分好みに見える化した話
Redmineの情報を自分好みに見える化した話Redmineの情報を自分好みに見える化した話
Redmineの情報を自分好みに見える化した話ToshiharuSakai
 
Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要
Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要
Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要オラクルエンジニア通信
 
『機械学習による故障予測・異常検知 事例紹介とデータ分析プロジェクト推進ポイント』
『機械学習による故障予測・異常検知 事例紹介とデータ分析プロジェクト推進ポイント』『機械学習による故障予測・異常検知 事例紹介とデータ分析プロジェクト推進ポイント』
『機械学習による故障予測・異常検知 事例紹介とデータ分析プロジェクト推進ポイント』The Japan DataScientist Society
 
Elasticsearch workshop 23_sql
Elasticsearch workshop 23_sqlElasticsearch workshop 23_sql
Elasticsearch workshop 23_sqlshinhiguchi
 
あなたはどうデータを守る?クラウド・AI・自動化を使った、みえない脅威との戦い方
あなたはどうデータを守る?クラウド・AI・自動化を使った、みえない脅威との戦い方あなたはどうデータを守る?クラウド・AI・自動化を使った、みえない脅威との戦い方
あなたはどうデータを守る?クラウド・AI・自動化を使った、みえない脅威との戦い方オラクルエンジニア通信
 
Big data解析ビジネス
Big data解析ビジネスBig data解析ビジネス
Big data解析ビジネスMie Mori
 
【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」松永充弘氏
【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」松永充弘氏【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」松永充弘氏
【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」松永充弘氏Developers Summit
 
Elasticsearchによるリモートワーク時代のセキュリティ対策
Elasticsearchによるリモートワーク時代のセキュリティ対策Elasticsearchによるリモートワーク時代のセキュリティ対策
Elasticsearchによるリモートワーク時代のセキュリティ対策Elasticsearch
 
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例Recruit Technologies
 
ソフトウェア工学における問題提起と機械学習の新たなあり方
ソフトウェア工学における問題提起と機械学習の新たなあり方ソフトウェア工学における問題提起と機械学習の新たなあり方
ソフトウェア工学における問題提起と機械学習の新たなあり方MLSE
 
今日こそわかる、安全なWebアプリの作り方2010
今日こそわかる、安全なWebアプリの作り方2010今日こそわかる、安全なWebアプリの作り方2010
今日こそわかる、安全なWebアプリの作り方2010Hiroshi Tokumaru
 

Similar to Supervised Machine Learning of Elastic Stack (20)

[db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ! by 株式会社日立製作所 村上順一
 [db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ!  by 株式会社日立製作所 村上順一 [db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ!  by 株式会社日立製作所 村上順一
[db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ! by 株式会社日立製作所 村上順一
 
How to organize data science project (データサイエンスプロジェクトの始め方101)
How to organize data science project (データサイエンスプロジェクトの始め方101)How to organize data science project (データサイエンスプロジェクトの始め方101)
How to organize data science project (データサイエンスプロジェクトの始め方101)
 
Oracle Data Miner で始める簡単・高速な機械学習
Oracle Data Miner で始める簡単・高速な機械学習Oracle Data Miner で始める簡単・高速な機械学習
Oracle Data Miner で始める簡単・高速な機械学習
 
超高速な機械学習を Oracle Database で実現!
超高速な機械学習を Oracle Database で実現!超高速な機械学習を Oracle Database で実現!
超高速な機械学習を Oracle Database で実現!
 
A3RT - the details and actual use cases of "Analytics & Artificial intelligen...
A3RT - the details and actual use cases of "Analytics & Artificial intelligen...A3RT - the details and actual use cases of "Analytics & Artificial intelligen...
A3RT - the details and actual use cases of "Analytics & Artificial intelligen...
 
A3RT -The details and actual use cases of“Analytics & Artificial intelligence...
A3RT -The details and actual use cases of“Analytics & Artificial intelligence...A3RT -The details and actual use cases of“Analytics & Artificial intelligence...
A3RT -The details and actual use cases of“Analytics & Artificial intelligence...
 
TERAS Conference
TERAS ConferenceTERAS Conference
TERAS Conference
 
SIOS iQ:機械学習 I T O A VMware仮想環境の性能問題の原因分析 迅速な問題解決と未然防止を実現
SIOS iQ:機械学習 I T O A VMware仮想環境の性能問題の原因分析 迅速な問題解決と未然防止を実現SIOS iQ:機械学習 I T O A VMware仮想環境の性能問題の原因分析 迅速な問題解決と未然防止を実現
SIOS iQ:機械学習 I T O A VMware仮想環境の性能問題の原因分析 迅速な問題解決と未然防止を実現
 
Redmineの情報を自分好みに見える化した話
Redmineの情報を自分好みに見える化した話Redmineの情報を自分好みに見える化した話
Redmineの情報を自分好みに見える化した話
 
Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要
Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要
Oracle Data Minerハンズオンセミナー170927:①Oracle 機械学習概要
 
『機械学習による故障予測・異常検知 事例紹介とデータ分析プロジェクト推進ポイント』
『機械学習による故障予測・異常検知 事例紹介とデータ分析プロジェクト推進ポイント』『機械学習による故障予測・異常検知 事例紹介とデータ分析プロジェクト推進ポイント』
『機械学習による故障予測・異常検知 事例紹介とデータ分析プロジェクト推進ポイント』
 
Elasticsearch workshop 23_sql
Elasticsearch workshop 23_sqlElasticsearch workshop 23_sql
Elasticsearch workshop 23_sql
 
あなたはどうデータを守る?クラウド・AI・自動化を使った、みえない脅威との戦い方
あなたはどうデータを守る?クラウド・AI・自動化を使った、みえない脅威との戦い方あなたはどうデータを守る?クラウド・AI・自動化を使った、みえない脅威との戦い方
あなたはどうデータを守る?クラウド・AI・自動化を使った、みえない脅威との戦い方
 
Big data解析ビジネス
Big data解析ビジネスBig data解析ビジネス
Big data解析ビジネス
 
【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」松永充弘氏
【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」松永充弘氏【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」松永充弘氏
【17-C-4】「Axure RPによる画面プロトタイプを活用した要件定義の改善:野村総合研究所、NTTデータの事例紹介」松永充弘氏
 
Elasticsearchによるリモートワーク時代のセキュリティ対策
Elasticsearchによるリモートワーク時代のセキュリティ対策Elasticsearchによるリモートワーク時代のセキュリティ対策
Elasticsearchによるリモートワーク時代のセキュリティ対策
 
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
 
ソフトウェア工学における問題提起と機械学習の新たなあり方
ソフトウェア工学における問題提起と機械学習の新たなあり方ソフトウェア工学における問題提起と機械学習の新たなあり方
ソフトウェア工学における問題提起と機械学習の新たなあり方
 
今日こそわかる、安全なWebアプリの作り方2010
今日こそわかる、安全なWebアプリの作り方2010今日こそわかる、安全なWebアプリの作り方2010
今日こそわかる、安全なWebアプリの作り方2010
 
データベースで始める機械学習
データベースで始める機械学習データベースで始める機械学習
データベースで始める機械学習
 

Supervised Machine Learning of Elastic Stack

  • 1. 1Copyright © Acroquest Technology Co., Ltd. All rights reserved. Elastic Stack7.6における 教師あり機械学習の紹介 Acroquest Technology株式会社 Senior Consultant / Elastic Certified Engineer 吉岡 洋 @Hirosh_Yoshioka
  • 2. はじめに Copyright © Acroquest Technology Co., Ltd. All rights reserved. 1. 今日話すこと ①Anomaly Detectionの概要 ②Data Frame Analyticsの概要 ← 教師あり機械学習はここ 2. 今日話さないこと ①機械学習のアルゴリズムや評価手法の詳細
  • 3. 目次 Copyright © Acroquest Technology Co., Ltd. All rights reserved. 1. Elastic MLにおける2種類の機械学習機能 1-1. Anomaly Detection 1-2. Data Frame Analytics 2. デモ 2-1. 分類による不良品予測
  • 4. 自己紹介 Copyright © Acroquest Technology Co., Ltd. All rights reserved. ⚫ 名前:吉岡 洋(よしおかひろし) ⚫ 所属:Acroquest Technology株式会社 (シニアコンサルタント) ⚫ 領域:全文検索/ビッグデータ分析/可視化 ⚫ その他: ─Microsoft MVP for Powershell(2006~2010) ─「Windows PowerShell宣言!」(2007) ─IBM Certified Specialist IBM SPSS Modeler Professional(2014~) ─Elastic Certified Engineer(2018~)
  • 5. Acroquest Technology株式会社 Copyright © Acroquest Technology Co., Ltd. All rights reserved. 1. 新横浜にあるITベンチャー ①Great Place To Work(R) Institute Japan実施 働きがいのある会社ランキング第1位(3回受賞) 2. 事業(データ活用ビジネス) ①Elastic Stack活用コンサルティングサービス – 検証/設計/構築/運用支援など – Elastic Certified Engineer:5名 ②IoTデータ分析プラットフォーム ③機械学習/AI
  • 6. 1. Elastic MLにおける 2種類の機械学習機能 Copyright © Acroquest Technology Co., Ltd. All rights reserved.
  • 7. 1-1. Anomaly Detection(Ver.5.5でGAリリース) Copyright © Acroquest Technology Co., Ltd. All rights reserved. 1. 特徴 ①時系列データの異常検知 ②教師なし機械学習 – 閾値判定で検知できない異常を 判定/検知可能 2. サポートする異常検知 ①トレンド異常検知 – 特定の周期を持った時系列データが過去と異なる振る舞いをしている ②Population Analysis – グループ内の特定の個体が他とは異なる挙動をしている 例)特定のIPアドレスからのアクセスだけ404レスポンスの数が多い 閾値判定だと 異常検知できない
  • 8. 1-1. Anomaly Detection(機能強化) Copyright © Acroquest Technology Co., Ltd. All rights reserved. 1. 分析プロセスの効率化 ① Data Visualizer(v6.1) ② CSVファイルのインポート機能(v6.5) ③ Annotation(v6.6) 2. モデル精度の向上 ① Calendar Management(学習対象除外日の設定、v6.2) ② Custom Rule(モデル更新条件/異常検知判定のルール制御、v6.4) ③ スコア計算アルゴリズムの改善(v6.5) – パーティション毎のスコア正規化/マルチバケット分析 3. 将来予測 ① Forecast(v6.1)
  • 9. 1-2. Data Frame Analytics(Ver.7.3~) Copyright © Acroquest Technology Co., Ltd. All rights reserved. 1. 特徴 ① 非時系列データの様々な分析 ② Elastic Stack単体で学習/推論が可能 – 学習:Data frame analytics APIまたはKibana UIで実施 – 推論:Ingest Node(Inference Processor)を利用する。(v7.6) 2. サポートする分析手法 No 分析タイプ 学習 推論 Version 備考 1 Outlier Detection(外れ値検知) なし ー v7.3 2 Regression(回帰) あり 可能 v7.4 3 Classification(分類) あり 可能 v7.5 二項分類にのみ対応 4 Language identification (言語識別) あり (プリセット) 可能 V7.6 109言語に対応
  • 10. 1-2. Data Frame Analytics(ユースケース) Copyright © Acroquest Technology Co., Ltd. All rights reserved. 1. 教師あり機械学習はBusiness Analytics領域で有用 Regression (回帰) Classification (分類) Language identification (言語識別) [信用リスク分析→未払いリスク低減] 債務者データから格付けスコアモデルを作成。 [アプリユーザ解約予測→解約防止キャンペーン] 顧客動向データから解約予測モデルを作成。 [問い合わせ言語判定→アサイン効率化] 問い合わせ内容を言語判定。適切な担当者をアサイン。
  • 11. 1-2. Data Frame Analytics(処理の流れ) Copyright © Acroquest Technology Co., Ltd. All rights reserved. ④推論 新規 インデックス ②Reindex 学習データ インデックス ②分析 モデル 学習データ インデックス 学習データ (検証データ) ①データ登録 Ingest Node (Inference Processor) テストデータ ③データ登録 ※②は以下のAPI ・Create data frame analytics jobs API ・Start data frame analytics jobs API 学習データ インデックス (+分析結果)
  • 12. 2. デモ Copyright © Acroquest Technology Co., Ltd. All rights reserved.
  • 13. 2-1. 分類による不良品予測 Copyright © Acroquest Technology Co., Ltd. All rights reserved. 1. デモデータ(製造/試験データ:1000件) ① p1~p12:12ステップある各製造過程での評価値 ② result:製造後の負荷試験結果(NGは不良品) 2. 分類を利用して不良品を予測する ① 説明変数:p1~p12 ② 目的変数:result p1 p2 p3 p4 p5 p6 p7 p8 p9 p10 p11 p12 result 1 28 1 0 1 65 158 1 12 5 B A NG 1 41 1 0 0 197 479 4 6 11 B B OK 1 44 1 0 0 0 651 6 3 7 B C OK 1 50 1 0 1 189 454 5 6 10 B C OK 1 25 1 0 1 153 368 7 4 5 B B OK
  • 14. 2-1. 分類による不良品予測 Copyright © Acroquest Technology Co., Ltd. All rights reserved. 1. 作成したモデルに対する推論のテスト(正解はNG) POST _ingest/pipeline/_simulate { "pipeline": { "processors": [ { "inference": { "model_id": "★model_id★", "inference_config": { "classification": {} }, "field_mappings": {} } } ] }, "docs": [ { "_source": { "p1" : 1, "p2" : 28, "p3" : 1, "p4" : 0, "p5" : 1, "p6" : 65, "p7" : 158, "p8" : 1, "p9" : 12, "p10" : 5, "p11" : "B", "p12" : "A" } } ] }
  • 15. まとめ Copyright © Acroquest Technology Co., Ltd. All rights reserved. 1. Elastic MLには2種類の機械学習機能がある ①Anomaly Detection(教師なし機械学習) ②Data Frame Analytics(教師あり機械学習) ※一部例外あり(Outlier Detectionは教師なし) 2. v7.6から教師あり機械学習の推論をサポート ①Elastic Stack単体での学習/推論が可能 ②Data Frame Analyticsが導入されたことで、 Business Analytics領域での活用が期待できる
  • 16. ご清聴ありがとうございました。 Evolve the Earth with Emotion of Technology Copyright © Acroquest Technology Co., Ltd. All rights reserved.