Submit Search
Upload
Devsumi 2018summer
•
23 likes
•
15,676 views
Harada Kei
Follow
デブサミ2018夏の原田の講演資料です。
Read less
Read more
Data & Analytics
Report
Share
Report
Share
1 of 21
Download now
Download to read offline
Recommended
For MANABIYA
For MANABIYA
ssuserafaae8
最近のKaggleに学ぶテーブルデータの特徴量エンジニアリング
最近のKaggleに学ぶテーブルデータの特徴量エンジニアリング
mlm_kansai
不均衡データのクラス分類
不均衡データのクラス分類
Shintaro Fukushima
DQNからRainbowまで 〜深層強化学習の最新動向〜
DQNからRainbowまで 〜深層強化学習の最新動向〜
Jun Okumura
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
RyuichiKanoh
多様な強化学習の概念と課題認識
多様な強化学習の概念と課題認識
佑 甲野
レコメンドエンジン作成コンテストの勝ち方
レコメンドエンジン作成コンテストの勝ち方
Shun Nukui
backbone としての timm 入門
backbone としての timm 入門
Takuji Tahara
Recommended
For MANABIYA
For MANABIYA
ssuserafaae8
最近のKaggleに学ぶテーブルデータの特徴量エンジニアリング
最近のKaggleに学ぶテーブルデータの特徴量エンジニアリング
mlm_kansai
不均衡データのクラス分類
不均衡データのクラス分類
Shintaro Fukushima
DQNからRainbowまで 〜深層強化学習の最新動向〜
DQNからRainbowまで 〜深層強化学習の最新動向〜
Jun Okumura
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
RyuichiKanoh
多様な強化学習の概念と課題認識
多様な強化学習の概念と課題認識
佑 甲野
レコメンドエンジン作成コンテストの勝ち方
レコメンドエンジン作成コンテストの勝ち方
Shun Nukui
backbone としての timm 入門
backbone としての timm 入門
Takuji Tahara
【DL輪読会】Scaling Laws for Neural Language Models
【DL輪読会】Scaling Laws for Neural Language Models
Deep Learning JP
敵対的生成ネットワーク(GAN)
敵対的生成ネットワーク(GAN)
cvpaper. challenge
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Yusuke Uchida
ブラックボックス最適化とその応用
ブラックボックス最適化とその応用
gree_tech
[DL輪読会]Understanding Black-box Predictions via Influence Functions
[DL輪読会]Understanding Black-box Predictions via Influence Functions
Deep Learning JP
グラフニューラルネットワーク入門
グラフニューラルネットワーク入門
ryosuke-kojima
機械学習のためのベイズ最適化入門
機械学習のためのベイズ最適化入門
hoxo_m
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
Tenki Lee
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
Shota Imai
Semantic segmentation
Semantic segmentation
Takuya Minagawa
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII
ブレインパッドにおける機械学習プロジェクトの進め方
ブレインパッドにおける機械学習プロジェクトの進め方
BrainPad Inc.
深層学習の数理
深層学習の数理
Taiji Suzuki
Graph Neural Networks
Graph Neural Networks
tm1966
深層生成モデルと世界モデル
深層生成モデルと世界モデル
Masahiro Suzuki
近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer
Yusuke Uchida
ChatGPT 人間のフィードバックから強化学習した対話AI
ChatGPT 人間のフィードバックから強化学習した対話AI
Shota Imai
機械学習モデルのハイパパラメータ最適化
機械学習モデルのハイパパラメータ最適化
gree_tech
全力解説!Transformer
全力解説!Transformer
Arithmer Inc.
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
Deep Learning JP
ZOZO前澤社長お年玉リツイート企画のビッグデータに立ち向かう方法 -Twitterのビッグデータを分析するために、実際にやってみてわかった嵌りポイントと...
ZOZO前澤社長お年玉リツイート企画のビッグデータに立ち向かう方法 -Twitterのビッグデータを分析するために、実際にやってみてわかった嵌りポイントと...
Kazuya Sugimoto
Google HomeとSharePointを連携させてみた! 第8回 jpsps share pointoffice365名古屋分科勉強会 at ge...
Google HomeとSharePointを連携させてみた! 第8回 jpsps share pointoffice365名古屋分科勉強会 at ge...
Kazuya Sugimoto
More Related Content
What's hot
【DL輪読会】Scaling Laws for Neural Language Models
【DL輪読会】Scaling Laws for Neural Language Models
Deep Learning JP
敵対的生成ネットワーク(GAN)
敵対的生成ネットワーク(GAN)
cvpaper. challenge
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Yusuke Uchida
ブラックボックス最適化とその応用
ブラックボックス最適化とその応用
gree_tech
[DL輪読会]Understanding Black-box Predictions via Influence Functions
[DL輪読会]Understanding Black-box Predictions via Influence Functions
Deep Learning JP
グラフニューラルネットワーク入門
グラフニューラルネットワーク入門
ryosuke-kojima
機械学習のためのベイズ最適化入門
機械学習のためのベイズ最適化入門
hoxo_m
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
Tenki Lee
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
Shota Imai
Semantic segmentation
Semantic segmentation
Takuya Minagawa
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII
ブレインパッドにおける機械学習プロジェクトの進め方
ブレインパッドにおける機械学習プロジェクトの進め方
BrainPad Inc.
深層学習の数理
深層学習の数理
Taiji Suzuki
Graph Neural Networks
Graph Neural Networks
tm1966
深層生成モデルと世界モデル
深層生成モデルと世界モデル
Masahiro Suzuki
近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer
Yusuke Uchida
ChatGPT 人間のフィードバックから強化学習した対話AI
ChatGPT 人間のフィードバックから強化学習した対話AI
Shota Imai
機械学習モデルのハイパパラメータ最適化
機械学習モデルのハイパパラメータ最適化
gree_tech
全力解説!Transformer
全力解説!Transformer
Arithmer Inc.
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
Deep Learning JP
What's hot
(20)
【DL輪読会】Scaling Laws for Neural Language Models
【DL輪読会】Scaling Laws for Neural Language Models
敵対的生成ネットワーク(GAN)
敵対的生成ネットワーク(GAN)
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
ブラックボックス最適化とその応用
ブラックボックス最適化とその応用
[DL輪読会]Understanding Black-box Predictions via Influence Functions
[DL輪読会]Understanding Black-box Predictions via Influence Functions
グラフニューラルネットワーク入門
グラフニューラルネットワーク入門
機械学習のためのベイズ最適化入門
機械学習のためのベイズ最適化入門
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
Semantic segmentation
Semantic segmentation
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
ブレインパッドにおける機械学習プロジェクトの進め方
ブレインパッドにおける機械学習プロジェクトの進め方
深層学習の数理
深層学習の数理
Graph Neural Networks
Graph Neural Networks
深層生成モデルと世界モデル
深層生成モデルと世界モデル
近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer
ChatGPT 人間のフィードバックから強化学習した対話AI
ChatGPT 人間のフィードバックから強化学習した対話AI
機械学習モデルのハイパパラメータ最適化
機械学習モデルのハイパパラメータ最適化
全力解説!Transformer
全力解説!Transformer
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
Similar to Devsumi 2018summer
ZOZO前澤社長お年玉リツイート企画のビッグデータに立ち向かう方法 -Twitterのビッグデータを分析するために、実際にやってみてわかった嵌りポイントと...
ZOZO前澤社長お年玉リツイート企画のビッグデータに立ち向かう方法 -Twitterのビッグデータを分析するために、実際にやってみてわかった嵌りポイントと...
Kazuya Sugimoto
Google HomeとSharePointを連携させてみた! 第8回 jpsps share pointoffice365名古屋分科勉強会 at ge...
Google HomeとSharePointを連携させてみた! 第8回 jpsps share pointoffice365名古屋分科勉強会 at ge...
Kazuya Sugimoto
第6回jduc勉強会 dynamics 365 新機能 外部apiと連携できる仮想エンティティの活用方法
第6回jduc勉強会 dynamics 365 新機能 外部apiと連携できる仮想エンティティの活用方法
Kazuya Sugimoto
DeNA の Slack 導入と活用の事例紹介
DeNA の Slack 導入と活用の事例紹介
DeNA
ITSP_JTUG_2210_SponsorSession.pdf
ITSP_JTUG_2210_SponsorSession.pdf
INTAGEGROUP
Amazon DynamoDB Advanced Design Pattern
Amazon DynamoDB Advanced Design Pattern
Amazon Web Services Japan
PPUG(PayPal User Group) #3 Lightning Talk by MaP design 渡部知記
PPUG(PayPal User Group) #3 Lightning Talk by MaP design 渡部知記
知記 渡部
Let's BBQ with us!!
Let's BBQ with us!!
Hironari Ono
株式会社ジール_採用ピッチ資料(2024.3.15) _zeal recruitment pitch
株式会社ジール_採用ピッチ資料(2024.3.15) _zeal recruitment pitch
zeal32
「2019年の目標と運営方針」を議論するための「2018年の振り返り」
「2019年の目標と運営方針」を議論するための「2018年の振り返り」
E2D3.org
Dynamics 365 Customer Engagement 理解のススメ -サブスクリプションビジネスモデルから読み解くカスタマーサポート機能活用の...
Dynamics 365 Customer Engagement 理解のススメ -サブスクリプションビジネスモデルから読み解くカスタマーサポート機能活用の...
Kazuya Sugimoto
JDBCで繋がるクラウドDB・NoSQL連携
JDBCで繋がるクラウドDB・NoSQL連携
CData Software Japan
分析のモダナイズへのヒント:データ価値を最大化するビジュアル分析とエンタープライズ組織への展開 - 経営課題解決シンポジウム (2018/09/28)
分析のモダナイズへのヒント:データ価値を最大化するビジュアル分析とエンタープライズ組織への展開 - 経営課題解決シンポジウム (2018/09/28)
Ryusuke Ashiya
デジマ事業会社×リモートワーク×技術者組織=で生まれた魔道書
デジマ事業会社×リモートワーク×技術者組織=で生まれた魔道書
Osamu Kawachi
解明! Dynamics 365 Web API 全体像! 第7回JDUC勉強会
解明! Dynamics 365 Web API 全体像! 第7回JDUC勉強会
Kazuya Sugimoto
JDBCで繋がるSaas連携
JDBCで繋がるSaas連携
CData Software Japan
20170719 GCPUG OSAKA #3
20170719 GCPUG OSAKA #3
Yuya Ohara
大規模プロジェクトの制作裏話〜改善から成し遂げるまでのプロセス〜
大規模プロジェクトの制作裏話〜改善から成し遂げるまでのプロセス〜
HatakeyamaAkihide
QnA Maker 逆入門
QnA Maker 逆入門
Yoshitaka Seo
SharePointとAzure Functionsを組み合わせた マルチクラウドなサーバーレスアーキテクチャの展開方法 Japan share poin...
SharePointとAzure Functionsを組み合わせた マルチクラウドなサーバーレスアーキテクチャの展開方法 Japan share poin...
Kazuya Sugimoto
Similar to Devsumi 2018summer
(20)
ZOZO前澤社長お年玉リツイート企画のビッグデータに立ち向かう方法 -Twitterのビッグデータを分析するために、実際にやってみてわかった嵌りポイントと...
ZOZO前澤社長お年玉リツイート企画のビッグデータに立ち向かう方法 -Twitterのビッグデータを分析するために、実際にやってみてわかった嵌りポイントと...
Google HomeとSharePointを連携させてみた! 第8回 jpsps share pointoffice365名古屋分科勉強会 at ge...
Google HomeとSharePointを連携させてみた! 第8回 jpsps share pointoffice365名古屋分科勉強会 at ge...
第6回jduc勉強会 dynamics 365 新機能 外部apiと連携できる仮想エンティティの活用方法
第6回jduc勉強会 dynamics 365 新機能 外部apiと連携できる仮想エンティティの活用方法
DeNA の Slack 導入と活用の事例紹介
DeNA の Slack 導入と活用の事例紹介
ITSP_JTUG_2210_SponsorSession.pdf
ITSP_JTUG_2210_SponsorSession.pdf
Amazon DynamoDB Advanced Design Pattern
Amazon DynamoDB Advanced Design Pattern
PPUG(PayPal User Group) #3 Lightning Talk by MaP design 渡部知記
PPUG(PayPal User Group) #3 Lightning Talk by MaP design 渡部知記
Let's BBQ with us!!
Let's BBQ with us!!
株式会社ジール_採用ピッチ資料(2024.3.15) _zeal recruitment pitch
株式会社ジール_採用ピッチ資料(2024.3.15) _zeal recruitment pitch
「2019年の目標と運営方針」を議論するための「2018年の振り返り」
「2019年の目標と運営方針」を議論するための「2018年の振り返り」
Dynamics 365 Customer Engagement 理解のススメ -サブスクリプションビジネスモデルから読み解くカスタマーサポート機能活用の...
Dynamics 365 Customer Engagement 理解のススメ -サブスクリプションビジネスモデルから読み解くカスタマーサポート機能活用の...
JDBCで繋がるクラウドDB・NoSQL連携
JDBCで繋がるクラウドDB・NoSQL連携
分析のモダナイズへのヒント:データ価値を最大化するビジュアル分析とエンタープライズ組織への展開 - 経営課題解決シンポジウム (2018/09/28)
分析のモダナイズへのヒント:データ価値を最大化するビジュアル分析とエンタープライズ組織への展開 - 経営課題解決シンポジウム (2018/09/28)
デジマ事業会社×リモートワーク×技術者組織=で生まれた魔道書
デジマ事業会社×リモートワーク×技術者組織=で生まれた魔道書
解明! Dynamics 365 Web API 全体像! 第7回JDUC勉強会
解明! Dynamics 365 Web API 全体像! 第7回JDUC勉強会
JDBCで繋がるSaas連携
JDBCで繋がるSaas連携
20170719 GCPUG OSAKA #3
20170719 GCPUG OSAKA #3
大規模プロジェクトの制作裏話〜改善から成し遂げるまでのプロセス〜
大規模プロジェクトの制作裏話〜改善から成し遂げるまでのプロセス〜
QnA Maker 逆入門
QnA Maker 逆入門
SharePointとAzure Functionsを組み合わせた マルチクラウドなサーバーレスアーキテクチャの展開方法 Japan share poin...
SharePointとAzure Functionsを組み合わせた マルチクラウドなサーバーレスアーキテクチャの展開方法 Japan share poin...
More from Harada Kei
輪講 20190711 keiharada_人狼知能プロジェクトの紹介
輪講 20190711 keiharada_人狼知能プロジェクトの紹介
Harada Kei
Kaggle meetup tokyo #6 スポンサーセッション
Kaggle meetup tokyo #6 スポンサーセッション
Harada Kei
Analyst meetup 0410_harada
Analyst meetup 0410_harada
Harada Kei
AIWolfPy v0.4.9
AIWolfPy v0.4.9
Harada Kei
Math meets datascience
Math meets datascience
Harada Kei
最近の俺_20160219
最近の俺_20160219
Harada Kei
KDDCUP2015_Seed71_Kaggle_tokyo
KDDCUP2015_Seed71_Kaggle_tokyo
Harada Kei
Santa2016_seed71
Santa2016_seed71
Harada Kei
More from Harada Kei
(8)
輪講 20190711 keiharada_人狼知能プロジェクトの紹介
輪講 20190711 keiharada_人狼知能プロジェクトの紹介
Kaggle meetup tokyo #6 スポンサーセッション
Kaggle meetup tokyo #6 スポンサーセッション
Analyst meetup 0410_harada
Analyst meetup 0410_harada
AIWolfPy v0.4.9
AIWolfPy v0.4.9
Math meets datascience
Math meets datascience
最近の俺_20160219
最近の俺_20160219
KDDCUP2015_Seed71_Kaggle_tokyo
KDDCUP2015_Seed71_Kaggle_tokyo
Santa2016_seed71
Santa2016_seed71
Devsumi 2018summer
1.
© DeNA Co., Ltd. Kaggleで描く成⻑戦略 〜個⼈編・組織編〜 July 27, 2018 原⽥ 慧 AIシステム部 DeNA Co., Ltd. Developers
Summit 2018 Summer • B会場(B-8) 17:00-17:45
2.
© DeNA Co., Ltd. はじめに n セッションの最後の10分くらい質問に答えるコーナーがあります n
下記のtwitterハッシュタグを使って質問を募集します ⁃ # devsumiB ⁃ 質問ないと寂しいから質問してね! 2
3.
© DeNA Co., Ltd. ⾃⼰紹介 n 原⽥
慧(Kei Harada) , @Seed57_cash ⁃ 数理学博⼠ -> データ分析コンサル会社 -> DeNA(2018/02〜) ⁃ DeNAのデータサイエンスチーム(いわゆるkaggler枠)のリーダー ⁃ Kaggle Master • Santa competition 2017/18 3位 • Santa competition 2016/17 10位 • Coupon Purchase Prediction 14位 • KDDCUP2015 2位(前職の会社でのチーム) • Save the ⾖腐!コンペ 2位 ⁃ 趣味のプロコン等 • Project Euler(state of the art) • AtCoder(⻘) • ⼈狼知能コンテスト 3
4.
© DeNA Co., Ltd. アウトライン n 機械学習
/ AI / データ分析 やってみたい? n 今までやってなかったけど、⾃分もやってみたい n じゃあKaggleやってみようぜ n 今後は会社として取り組みたい n じゃあKaggle推奨してkaggler増やしてみなよ 4
5.
© DeNA Co., Ltd. n 機械学習モデルを構築するコンペティションのプラットフォーム Kaggle(カグル)とは 5 スポンサーがデータ と問題を出す 参加者(Kaggler)はデータを 分析してモデルを作り、 予測結果を出す 期間中(2-3ヶ⽉が多い)、 何度も予測結果を提出し て、精度を確認できる コンピュータに よる⾃動採点 期間終了時のベストスコアで順 位が付き、賞⾦とメダルを授与 Master Expert Contributor Novice GrandMaster メダルがたまると Kagglerとしてのラ ンクが上がる
6.
© DeNA Co., Ltd. 最近のKaggleコンペの例 n ローンのデフォルトを予測する n
ユーザーが不正なアクセスをしているかどうか予測する n 観光名所の画像を検索する n 掲⽰板への書き込みが削除対象かどうか判断する n 商品の販売価格を予測する n などなど 6
7.
© DeNA Co., Ltd. よくある批判 n Kaggleなんかやって何の役に⽴つの? n
じゃあ、あなたは何の役に⽴つのですか? ⁃ 精度の0.0001とか競って何になるの? • ⾞に対するF1みたいなもの(前職の親会社の⼈の⾔葉) • 競う中で「安全運転」もわかってくる ⁃ 勝つためのテクニックの移り変わりが早く、廃れるのが早い • 事実としてはその通り、「新しいテクニックを⾝につける」というスキルがいまのご時世どれだけ重 要か考えてほしい ⁃ サイエンス特化ではなくて、バランス⼈材が⼤事ではないか • なんでもできて、仕事をリードする⼈は素晴らしい。なんでも半⼈前にしかできない⼈は律速段階に なり、⼀番役に⽴たない、まず何かで⼀⼈前になるべき • ⼀⼈で何でも⼀流にできるスーパーマンは本当に稀で代替が効かない、⼀⼈のスキルに依存するのは 組織としてはダメなこと • 仕事なのだからチーム全体としてなんとかなればいい 7
8.
© DeNA Co., Ltd. Kaggleで学べること ≒
Data Scientistに必要なスキル n よく英語の資料で⾒かける必要スキル ⁃ 数学、数学的な思考 ⁃ 統計 ⁃ 機械学習の理論 ⁃ コーディング(主にpythonの⼀部ライブラリ / R, SQL) ⁃ データの可視化 ⁃ データハンドリング ⁃ データ収集 ⁃ データを扱う「勘」 • 参考:8 Skills you need to be a Data Scientist (https://blog.udacity.com/2014/11/data- science-job-skills.html) n Hacker Mindset も、仕事上もKaggle上でも重要 8 真⾯⽬にやっていれば 習得不可避 上位を⽬指していると 必要に迫られる 学ぼうと思えば題材が ある
9.
© DeNA Co., Ltd. Kaggleを始めるのに必要なスキル n 始めるのに必要なスキルは多岐にわたる ⁃
数学・統計 ⁃ 機械学習の理論 ⁃ コーディングスキル n 達⼈になるには必要かもしれないが、始めるだけならいらない ⁃ スゴい⼈たちも最初からスゴかったわけじゃない n やる気があればなんとかなる ⁃ Hello world的な問題もたくさんある • Titanic, Digit Recognizer, 等 ⁃ 新しい仕事、新しいプログラミング⾔語を学び始めるのと同じ 9
10.
© DeNA Co., Ltd. 個⼈編: Kagglerにせまる 10
11.
© DeNA Co., Ltd. なぜkagglerはKaggleをやるのか? n 賞⾦ ⁃
優勝賞⾦は結構⾼額(数万〜数⼗万ドル) ⁃ 始めるきっかけには⼗分だが、継続する理由ではない • 累積獲得賞⾦ / 累積kaggle時間 = 時給 は考えたくないほど低い n ⾯⽩い、⾃⼰顕⽰ ⁃ ネトゲで上位争いをする感覚に近い n データ分析の勉強のため ⁃ 普段は触れられないデータや、新しいテーマに触れることができる ⁃ ヘタに論⽂を読むよりも、コンペに真⾯⽬に参加して、上位⼊賞者の解法を⾒た⽅がわか りやすい n ⾃⼰PRのため ⁃ 採⽤活動に利⽤するケースが⽇本でもここ数年増えてきた ⁃ Kaggle masterになると転職市場での価値が上がる 11
12.
© DeNA Co., Ltd. どんな⼈が強いkagglerになっているのか n 数学・物理等の理論系出⾝ ⁃
たまたまデータ分析が仕事になったことがきっかけ ⁃ 数学、統計、機械学習の理論への親和性が⾼いので、きっかけさえあればスキルは活かし やすい n 機械学習関連分野(画像処理、⾃然⾔語処理など)出⾝ ⁃ 特定の分野に強くて、初めてみたら⾯⽩いからほかもやってみたら⾯⽩くなった、という ケース n プロコン勢 ⁃ Kaggleも幅広に⾔えばプロコンの⼀種 ⁃ 新しいことを始めるスキルが⾼い、すごく強い⼈はここに多い n データ分析関連のエンジニア出⾝ ⁃ 仕事の幅を広げてきたケース ⁃ まだ少数派の印象 12
13.
© DeNA Co., Ltd. Kagglerが得意なこと n 精度の⾼いモデルを作る n
モデルの評価・検証の仕組みの設計 n ⾼速でモデル構築を終わらせる ⁃ 普段やってるので経験もコードの蓄積もある n 幅広い引き出しから適切な分析⼿法を選ぶ ⁃ Kaggleで⾊々試しているので勘所がわかる • 特にダメなケースは「最近勉強したこの⼿法をやってみたいから」 n データを⾒てあれこれ考える ⁃ 特徴量を作る作業の副作⽤ ⁃ 裏にあるデータ処理のミスに気づく、とか n 論⽂を読んで何となく理解する ⁃ 新しいことを学ぶ能⼒が鍛えられている 13
14.
© DeNA Co., Ltd. Kagglerが得意とは限らないこと(1) n データ処理、蓄積の設計 ⁃
Kaggleではすでに処理されたデータが与えられるので、Kaggleでは必要ではな い n 解決すべき問題の⼤枠の設計 ⁃ Kaggleではすでに設計されている ⁃ 問題をそもそもひっくり返すちゃぶ台返しは、仕事では重要だがKaggleではや っても仕⽅がない n 可視化、わかりやすく説明する ⁃ 最後にモデルができさえすればいい n 綺麗なコードを書く ⁃ これで実装してください.R の品質は個⼈差が⼤きい n Kaggleを禁⽌されること 14
15.
© DeNA Co., Ltd. Kagglerが得意とは限らないこと(2) n 多くの⼈とコミュニケーションする ⁃
会議よりも⾃分の作業に集中したい、というタイプが多い • けして⼈間嫌いなわけではない ⁃ 仕事の範囲が明確である⽅がいい n 論⽂を書かされる ⁃ 論⽂が読めると書けるは全然違う。研究者のレベルでの最先端のキャッチアッ プ(誰よりも先にarXivから論⽂を⾒つける、とか)はkaggleでは必要ではない n 隙のない教養、体系的な学習 ⁃ 「えっ〇〇本読んでないの?」というようなケース ⁃ Leaderboardで結果が出るものに興味がある n 何年も⼀つの仕事をする ⁃ 新しいことへの好奇⼼が強い⼈が多い 15
16.
© DeNA Co., Ltd. 組織編:会社でKagglerがどう働くのか 16
17.
© DeNA Co., Ltd. Kagglerにとって何が幸せか n 「不仕合せ」の最⼩化 ⁃
会社で仕事をするのは幸せばかりでない • 働かずにノーリスクで同じ年収もらえるなら、働きたくない、よね? ⁃ 「幸せ」を積極的に与えるのは難しくて、不幸な巡り合わせを減らすことが会 社としてできること • 多くの⼈とコミュニケーションする → 仕事の疎結合化 • 論⽂を書かされる、隙のない教養、体系的な学習 → 正しい理解 • 何年も⼀つの仕事をする → 適切なアサイン • Kaggleを禁⽌される → 禁⽌しない ⁃ 得意でないことは得意な⼈と組んで⼀緒にやればいい • データ処理、蓄積の設計 • 綺麗なコードを書く • 可視化、わかりやすく説明する • 解決すべき問題の⼤枠の設計 17
18.
© DeNA Co., Ltd. DeNA の場合 18
19.
© DeNA Co., Ltd. DeNA Kaggle社内ランク制度 n データサイエンス部⾨内の制度 n
業務時間の⼀定割合(通常は20-30%をKaggleに投⼊して良い) ⁃ 毎年⼀定の結果を出すことが条件 19
20.
© DeNA Co., Ltd. DeNAのデータサイエンティストの役割 20 分析を⾏う 組織体制 AIアルゴリズム系エンジニア AI研究開発エンジニア データサイエンティスト
(Kaggler) AI 基盤系エンジニア AIデータエンジニア AI・分析ツールエンジニア AI・分析インフラエンジニア 分散基盤エンジニア AIシステム部 (全社横断) AI研究開発 エンジニア データ サイエンティスト • コンピュータビジョン、深層強化学習等の AI研究領域に⾼い専⾨性を持つ • ⽇々、最新研究動向をウォッチし、 専⾨技術を活⽤して事業貢献する • サービス・事業の抱える分析課題を解くことに燃える集団 • ⼿段を問わず、最⾼の分析結果を出すことに泥臭くコミット サービス 事業組織 各サービスに事業をリ ードするプロがいる 実装周りのプロはAI基盤系エンジニアがいる 最先端研究の活⽤のプ ロは別途いる データサイエンティス トは強みに集中できる
21.
© DeNA Co., Ltd. まとめ n KaggleをやるとData
Scientistになるのに必要なスキルが⾝につく ⁃ しかも楽しい! n Kagglerにはいろんな⼈がいて、できることも様々 n Kagglerには得意なことと、そうでないことがある ⁃ 個⼈差もかなりある ⁃ 正しく理解して、強みに集中させる ⁃ できないことは他の⼈がフォローする • データ処理、蓄積の設計 • 綺麗なコードを書く • 可視化、わかりやすく説明する • 解決すべき問題の⼤枠の設計 21
Download now