SlideShare a Scribd company logo
1 of 19
Download to read offline
趣味の機械学習サイトにおける	
工夫紹介	
MACHINE	LEARNING	Meetup	Kansai		#3	
はてな id:syou6162	
1
自己紹介	
•  id:syou6162(本名:	吉田康久)	
•  前職:	自然言語処理や機械学習の研究職	
•  2年前にはてなに転職	
2
Mackerel:	サーバーの異常検知	
3	
•  ルールを書く必要なし	
•  約20次元を考慮	
•  どのメトリックがおかしいか
根拠も提示	
参考:	hFps://www.yasuhisay.info/entry/mackerel_meetup_12_anomaly_detecMon
はてなにおける	
機械学習の取り組み	
id:syou6162	
MACHINE	LEARNING	Meetup	
KANSAI#1	
4	
•  再現性や属人性、機械学習で
難しいところをはてながどう組
織で取り組んでいるか紹介	
参考:	hFps://www.slideshare.net/syou6162/ss-93425042
デブサミ2018関西	
5	
•  機械学習の第一歩をどう踏み出すか	
•  機械学習におけるアプリケーションエンジニアの強み	
•  Machine	Learning	Kansai	Meetupの紹介	
参考:	hFps://www.yasuhisay.info/entry/2018/10/01/090000
ML	News	
•  趣味で運用している機械学習関連のエントリを
集めて見せているサイト	
–  hFps://www.machine-learning.news	
–  これ自身も機械学習を使ってる	
•  作ったモチベーション		
–  気になった機械学習技術をいきなりプロダクションに
入れるのは大変	
–  自分で遊べる砂場が欲しい	
•  あくまで趣味なので手間をあまりかけたくない	
–  今日は運用での工夫について話します	
6
こんなサイト	
7
アジェンダ	
•  能動学習による効率的なアノテーション	
•  精度の継続的なトラッキングを簡単に	
•  多様性を持たせた簡単な推薦方法	
•  パイプラインジャングルと戦う	
8
アダルト	
まとめサイト	
深層学習	
異常検知	
分離平面	
Python	クローラー	
CoreML	
iPhone	
アプリ おすすめ	
能動学習による効率的なアノテーション	
機械学習	Python	
アフィリエイトサイト	
9
分離平面	
能動学習による効率的なアノテーション	
この辺ばかりアノテーションしていても	
-  精度は上がらない	
-  精神は病むので、つらい	
-  しかし、ランダムに選ぶとこの辺がたくさん…	
10	
アダルト	
まとめサイト	
Python	クローラー	iPhone	
アプリ おすすめ	
アフィリエイトサイト	
深層学習	
異常検知	
CoreML	
機械学習	Python
分離平面	
能動学習による効率的なアノテーション	
分離平面に近い(=分類器があまり自信がない)
事例から優先的にアノテーション	
11	
アダルト	
まとめサイト	
Python	クローラー	iPhone	
アプリ おすすめ	
アフィリエイトサイト	
深層学習	
異常検知	
CoreML	
機械学習	Python
•  同じ400件をアノテーションするならば、より精度
が高い分類器を作れる400件のほうがよい	
hFp://www.yasuhisay.info/
entry/2017/05/18/080000	
	
hFps://github.com/syou6162/go-
acMve-learning	
能動学習による効率的なアノテーション	
12
精度の継続的なモニタリング	
•  コマンドラインツール(mkr)や各種言
語のライブラリから投稿可能	
•  各メトリックに対して閾値を設定して
閾値を割ったらslackに通知	
13
精度の可視化	
•  任意の時点にアノテーションを追加	
•  Gitのコミットハッシュ値やPull	Requestへ
のリンクを貼っておくと便利	
•  mackerel.io	
14
推薦リストの構築(1)	
•  スコアが高いものはarXivの論文ばかり…	
•  データ基盤の話や面白事例のエントリも読み
たい!	推薦されたリストに多様性が欲しい!	
•  文書要約も似たような問題設定	
– 文書全体の話題をカバーしつつ重要なところを
ピックアップ	
– ナイーブにやると2^Nの組合せがある	
15
推薦リストの構築(2)	
•  目的関数が劣モジュラと呼ばれる形式だと貪欲
法で簡単に解ける	
–  目的関数:	td-idfから構成される簡単な関数	
–  賢い人が「最悪ケースでもこれ以下にはならない」と
理論保証を与えてくれている	
•  Golangで約100行	
–  hFps://github.com/syou6162/go-acMve-learning-
web/blob/master/lib/apply/apply.go	
–  hFps://www.yasuhisay.info/entry/
2017/05/27/213200	
16
パイプラインジャングル	
•  機械学習アプリではパイプラインジャングル
になりがち	
•  昔はJenkinsで以下を調整していた	
– 分類対象候補データのクローリング	
– 前処理	
– 学習	
– 予測	
– 推薦リストの構築	
– Slackへの通知	
問題点	
•  cronの時間調整アホらしい	
•  前段の処理で失敗したら後段の
処理は走らないで欲しい	
•  どこでこけたか調査が面倒	
17
解法:	AWS	StepFuncMons	
推薦対象候補の
クローリング	
学習/予測および
推薦リストの構築	
利点	
•  個々のパーツの自由度
が高い(Lambda/ECS	
task/AWS	Batch	Job)	
•  どこでこけたか一目瞭然	
•  こけたらexponenMal	
backoffで再実行	
•  管理サーバー必要なし	
•  設定がJSONで書ける	
18	hFps://www.yasuhisay.info/entry/machine_learning_workflow_with_step_funcMons
まとめ	
•  能動学習による効率的なアノテーション	
•  精度の継続的なトラッキングを簡単に	
•  多様性を持たせた簡単な推薦方法	
•  パイプラインジャングルと戦う	
19	
•  詳しい話を聞きたい、うちではこんな感じでやっているという
人、懇親会で話しましょう!	
•  来月くらいに論文読み会(ACL/KDD/WWW/SIGIR/ICMLなど
など)をはてなで企画。興味ある人ははてな社員に話しかけ
てください!

More Related Content

Similar to 機械学習を使った趣味サービスにおける工夫紹介

Mackerelのロール内異常検知の設計と運用
Mackerelのロール内異常検知の設計と運用Mackerelのロール内異常検知の設計と運用
Mackerelのロール内異常検知の設計と運用syou6162
 
はてなにおける機械学習の取り組み
はてなにおける機械学習の取り組みはてなにおける機械学習の取り組み
はてなにおける機械学習の取り組みsyou6162
 
今日から始める機械学習〜はてなの事例〜
今日から始める機械学習〜はてなの事例〜今日から始める機械学習〜はてなの事例〜
今日から始める機械学習〜はてなの事例〜syou6162
 
スパース性に基づく機械学習(機械学習プロフェッショナルシリーズ) 2.3節〜2.5節
スパース性に基づく機械学習(機械学習プロフェッショナルシリーズ) 2.3節〜2.5節スパース性に基づく機械学習(機械学習プロフェッショナルシリーズ) 2.3節〜2.5節
スパース性に基づく機械学習(機械学習プロフェッショナルシリーズ) 2.3節〜2.5節Hakky St
 
Kaggle の Titanic チュートリアルに挑戦した話
Kaggle の Titanic チュートリアルに挑戦した話Kaggle の Titanic チュートリアルに挑戦した話
Kaggle の Titanic チュートリアルに挑戦した話y-uti
 
IT技術者でも1から学べるビジネスモデルキャンバス入門
IT技術者でも1から学べるビジネスモデルキャンバス入門IT技術者でも1から学べるビジネスモデルキャンバス入門
IT技術者でも1から学べるビジネスモデルキャンバス入門陽一 滝川
 

Similar to 機械学習を使った趣味サービスにおける工夫紹介 (6)

Mackerelのロール内異常検知の設計と運用
Mackerelのロール内異常検知の設計と運用Mackerelのロール内異常検知の設計と運用
Mackerelのロール内異常検知の設計と運用
 
はてなにおける機械学習の取り組み
はてなにおける機械学習の取り組みはてなにおける機械学習の取り組み
はてなにおける機械学習の取り組み
 
今日から始める機械学習〜はてなの事例〜
今日から始める機械学習〜はてなの事例〜今日から始める機械学習〜はてなの事例〜
今日から始める機械学習〜はてなの事例〜
 
スパース性に基づく機械学習(機械学習プロフェッショナルシリーズ) 2.3節〜2.5節
スパース性に基づく機械学習(機械学習プロフェッショナルシリーズ) 2.3節〜2.5節スパース性に基づく機械学習(機械学習プロフェッショナルシリーズ) 2.3節〜2.5節
スパース性に基づく機械学習(機械学習プロフェッショナルシリーズ) 2.3節〜2.5節
 
Kaggle の Titanic チュートリアルに挑戦した話
Kaggle の Titanic チュートリアルに挑戦した話Kaggle の Titanic チュートリアルに挑戦した話
Kaggle の Titanic チュートリアルに挑戦した話
 
IT技術者でも1から学べるビジネスモデルキャンバス入門
IT技術者でも1から学べるビジネスモデルキャンバス入門IT技術者でも1から学べるビジネスモデルキャンバス入門
IT技術者でも1から学べるビジネスモデルキャンバス入門
 

More from syou6162

自分の目的に合った統計量と そのバラ付きを計算しよう ~NPSを例に~(統計学勉強会)
自分の目的に合った統計量と そのバラ付きを計算しよう ~NPSを例に~(統計学勉強会)自分の目的に合った統計量と そのバラ付きを計算しよう ~NPSを例に~(統計学勉強会)
自分の目的に合った統計量と そのバラ付きを計算しよう ~NPSを例に~(統計学勉強会)syou6162
 
オープンセミナー岡山 これから始めるデータ活用
オープンセミナー岡山 これから始めるデータ活用オープンセミナー岡山 これから始めるデータ活用
オープンセミナー岡山 これから始めるデータ活用syou6162
 
正確な意思決定を阻む 問題・障害との向き合い方
正確な意思決定を阻む 問題・障害との向き合い方正確な意思決定を阻む 問題・障害との向き合い方
正確な意思決定を阻む 問題・障害との向き合い方syou6162
 
カスタマーサクセスのためのデータ整備人の活動記録
カスタマーサクセスのためのデータ整備人の活動記録カスタマーサクセスのためのデータ整備人の活動記録
カスタマーサクセスのためのデータ整備人の活動記録syou6162
 
Mackerel Drink Up #9 ロール内異常検知の正式化
Mackerel Drink Up #9 ロール内異常検知の正式化Mackerel Drink Up #9 ロール内異常検知の正式化
Mackerel Drink Up #9 ロール内異常検知の正式化syou6162
 
教師なし学習によるMackerelの異常検知機能について 〜設計/運用/評価の観点から〜
教師なし学習によるMackerelの異常検知機能について〜設計/運用/評価の観点から〜教師なし学習によるMackerelの異常検知機能について〜設計/運用/評価の観点から〜
教師なし学習によるMackerelの異常検知機能について 〜設計/運用/評価の観点から〜syou6162
 
機械学習を用いたMackerelの異常検知機能について
機械学習を用いたMackerelの異常検知機能について機械学習を用いたMackerelの異常検知機能について
機械学習を用いたMackerelの異常検知機能についてsyou6162
 
Mackerel Anomaly Detection at PyCon mini Osaka
Mackerel Anomaly Detection at PyCon mini OsakaMackerel Anomaly Detection at PyCon mini Osaka
Mackerel Anomaly Detection at PyCon mini Osakasyou6162
 
異常検知ナイト LT登壇資料 はてな id:syou6162
異常検知ナイト LT登壇資料 はてな id:syou6162異常検知ナイト LT登壇資料 はてな id:syou6162
異常検知ナイト LT登壇資料 はてな id:syou6162syou6162
 
Duolingo.pptx
Duolingo.pptxDuolingo.pptx
Duolingo.pptxsyou6162
 
今日からできる構造学習(主に構造化パーセプトロンについて)
今日からできる構造学習(主に構造化パーセプトロンについて)今日からできる構造学習(主に構造化パーセプトロンについて)
今日からできる構造学習(主に構造化パーセプトロンについて)syou6162
 
Kernel20110619
Kernel20110619Kernel20110619
Kernel20110619syou6162
 
Optimization In R
Optimization In ROptimization In R
Optimization In Rsyou6162
 
Syou6162 Dbcls
Syou6162 DbclsSyou6162 Dbcls
Syou6162 Dbclssyou6162
 
半教師あり学習
半教師あり学習半教師あり学習
半教師あり学習syou6162
 
R User Group 2009 Yoshida
R User Group 2009 YoshidaR User Group 2009 Yoshida
R User Group 2009 Yoshidasyou6162
 
Short Essay
Short EssayShort Essay
Short Essaysyou6162
 
Algorithm Design
Algorithm DesignAlgorithm Design
Algorithm Designsyou6162
 

More from syou6162 (20)

自分の目的に合った統計量と そのバラ付きを計算しよう ~NPSを例に~(統計学勉強会)
自分の目的に合った統計量と そのバラ付きを計算しよう ~NPSを例に~(統計学勉強会)自分の目的に合った統計量と そのバラ付きを計算しよう ~NPSを例に~(統計学勉強会)
自分の目的に合った統計量と そのバラ付きを計算しよう ~NPSを例に~(統計学勉強会)
 
オープンセミナー岡山 これから始めるデータ活用
オープンセミナー岡山 これから始めるデータ活用オープンセミナー岡山 これから始めるデータ活用
オープンセミナー岡山 これから始めるデータ活用
 
正確な意思決定を阻む 問題・障害との向き合い方
正確な意思決定を阻む 問題・障害との向き合い方正確な意思決定を阻む 問題・障害との向き合い方
正確な意思決定を阻む 問題・障害との向き合い方
 
カスタマーサクセスのためのデータ整備人の活動記録
カスタマーサクセスのためのデータ整備人の活動記録カスタマーサクセスのためのデータ整備人の活動記録
カスタマーサクセスのためのデータ整備人の活動記録
 
Mackerel Drink Up #9 ロール内異常検知の正式化
Mackerel Drink Up #9 ロール内異常検知の正式化Mackerel Drink Up #9 ロール内異常検知の正式化
Mackerel Drink Up #9 ロール内異常検知の正式化
 
教師なし学習によるMackerelの異常検知機能について 〜設計/運用/評価の観点から〜
教師なし学習によるMackerelの異常検知機能について〜設計/運用/評価の観点から〜教師なし学習によるMackerelの異常検知機能について〜設計/運用/評価の観点から〜
教師なし学習によるMackerelの異常検知機能について 〜設計/運用/評価の観点から〜
 
機械学習を用いたMackerelの異常検知機能について
機械学習を用いたMackerelの異常検知機能について機械学習を用いたMackerelの異常検知機能について
機械学習を用いたMackerelの異常検知機能について
 
Mackerel Anomaly Detection at PyCon mini Osaka
Mackerel Anomaly Detection at PyCon mini OsakaMackerel Anomaly Detection at PyCon mini Osaka
Mackerel Anomaly Detection at PyCon mini Osaka
 
異常検知ナイト LT登壇資料 はてな id:syou6162
異常検知ナイト LT登壇資料 はてな id:syou6162異常検知ナイト LT登壇資料 はてな id:syou6162
異常検知ナイト LT登壇資料 はてな id:syou6162
 
Duolingo.pptx
Duolingo.pptxDuolingo.pptx
Duolingo.pptx
 
今日からできる構造学習(主に構造化パーセプトロンについて)
今日からできる構造学習(主に構造化パーセプトロンについて)今日からできる構造学習(主に構造化パーセプトロンについて)
今日からできる構造学習(主に構造化パーセプトロンについて)
 
Kernel20110619
Kernel20110619Kernel20110619
Kernel20110619
 
Optimization In R
Optimization In ROptimization In R
Optimization In R
 
Syou6162 Dbcls
Syou6162 DbclsSyou6162 Dbcls
Syou6162 Dbcls
 
半教師あり学習
半教師あり学習半教師あり学習
半教師あり学習
 
R User Group 2009 Yoshida
R User Group 2009 YoshidaR User Group 2009 Yoshida
R User Group 2009 Yoshida
 
Tsukuba
TsukubaTsukuba
Tsukuba
 
Short Essay
Short EssayShort Essay
Short Essay
 
Prml
PrmlPrml
Prml
 
Algorithm Design
Algorithm DesignAlgorithm Design
Algorithm Design
 

Recently uploaded

デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 

Recently uploaded (8)

デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 

機械学習を使った趣味サービスにおける工夫紹介