SlideShare a Scribd company logo
1 of 36
Download to read offline
Kaggle&競プロ紹介 in 中田研究室
@東京工業大学 工学院 経営工学系 水野・中田研究室
Takami Sato
2017/11/22Kaggle&競プロ紹介 1
Kaggleとは?
2017/11/22Kaggle&競プロ紹介 2
• 与えられたデータに対して予測スコアを競う
• コンペ中に見れるデータの大体25%を使ったPublic LBと
コンペ後に最終順位を決める大体75%を使ったPrivate LB
現行Featuredコンペ紹介 (口頭)
2017/11/28Kaggle&競プロ紹介 3
Kaggleとは?
2017/11/22Kaggle&競プロ紹介 4
議論を行うDiscussionや
Kaggleとは?
2017/11/22Kaggle&競プロ紹介 5
PythonやRが実行出来るKernelが存在
http://blog.kaggle.com/2017/09/21/product-launch-amped-up-kernels-resources-code-tips-hidden-cells/
Kaggleとは?
2017/11/22Kaggle&競プロ紹介 6
Rankingがあって
世界中のデータサイエンティストが殴り合ってる
私がKaggle Masterです
2017/11/22Kaggle&競プロ紹介 7
Kaggle Masterって?
世界に900人ぐらい、
2017/11/22Kaggle&競プロ紹介 8
大体 Top10が1回と、Top 10%が2回必要
Top 10に入るのは本当に難しい
(Kernel MasterやDiscussion Masterはまた別)
Kaggle Masterここが凄い!
• 凄いところ!
– 就活に有利!
– どこに行っても話を聞いてもらえる
– 肩書で殴れる
• データ分析界隈必要スキルセットが曖昧なので諸々楽
• 凄くないところ!
– データ分析の仕事が出来るようになるわけではない
• よいKernelを作れる人は素質アリ
2017/11/22Kaggle&競プロ紹介 9
今日の内容
中田先生から非常にレベルの高い学生と伺ったので・・・
2017/11/22Kaggle&競プロ紹介 10
機械学習の初歩は飛ばして、
如何にコンペを戦ったか、
如何にスコアを上げたかを話します
主に参加したコンペ
• Bosch Production Line Performance, 15th
– センサー情報から製品ラインの不良品検知
• Quora Question Pairs, 17th
– ある質問とある質問が同じ意味かを予測
• Instacart Market Basket Analysis, 15th
– スーパーの再来訪時の再購入予測
2017/11/22Kaggle&競プロ紹介 11
Bosch Production Line Performance
2017/11/22Kaggle&競プロ紹介 12
センサー情報から製品ラインの不良品検知
Bosch Production Line Performance
2017/11/22Kaggle&競プロ紹介 13
センサー情報から製品ラインの不良品検知
一緒に参加したhskkskさんの資料から今日は抜粋
https://www.slideshare.net/hskksk/kaggle-bosch
Bosch Production Line Performance概要
2017/11/22Kaggle&競プロ紹介 14
• タスク
– センサー情報から不良有無の0-1予測
– センサー値と測定時間がデータ
• 評価指標(MCC)
データが不均衡
なときに有効な
指標
※閾値を決める必要アリ
特徴量
2017/11/22Kaggle&競プロ紹介 15
特徴を全部文字列と思って、
ハッシュ値の頻度を使用
通過時間とセンサー値の組
み合わせを考慮
NULLが非常に多いデータで
NULLのパターンを使用
Bosch Production Line Performance
• 学習器はxgboostを使用
• このコンペではDartが上手く働いた
• スタッキングやアンサンブルは試したけど、
上手く行かなかったのでシングルモデル
2017/11/22Kaggle&競プロ紹介 16
Quora Question Pairs
2017/11/22Kaggle&競プロ紹介 17
https://www.kaggle.com/c/quora-question-pairs
Quora Question Pairs
2017/11/22Kaggle&競プロ紹介 18
Quora Question Pairs
2017/11/22Kaggle&競プロ紹介 19
https://www.slideshare.net/tkm2261/quora-76995457
過去に話した資料から抜粋して話します
Publicスコアの推移
2017/11/29Kaggle&競プロ紹介 20
– ステージ0: doc2vecの時代 (LB:0.5)
– ステージ1: anokasさんカーネルの時代(LB:0.35)
– ステージ2: word一致系の時代(LB:0.30)
– ステージ3: Word Embeddingの時代(LB:0.25)
– ステージ4: NLP特徴の時代(LB:0.2)
– ステージ5: グラフの幕開け(LB: 0.13)
– ステージ6: 倦怠期(LB: 0.13)
– ステージ7: スタッキングの時代(LB: 0.122)
ステージ4までの特徴量
2017/11/27Kaggle&競プロ紹介 21
ステージ5: グラフの幕開け(LB: 0.13)
2017/11/22Kaggle&競プロ紹介 22
人生の夢のひとつが叶った!
2017/11/22Kaggle&競プロ紹介 23
Deep Learning系の特徴
無くても大丈夫だったが、手元では試していた
2017/11/22Kaggle&競プロ紹介 24
こんな感じでKernelでコードが共有されるので、
DNN興味あるけど手を出せてない人にKaggleはオススメ
Instacart Market Basket Analysis
2017/11/22Kaggle&競プロ紹介 25
買い物代行スーパーの再購入予測
評価指標
2017/11/22Kaggle&競プロ紹介 26
mean F1 score
※提出ファイル例
購買なしのNoneも商品として提出出来るのが特徴
特徴量
9割の特徴はBigQueryで作成
2017/11/22Kaggle&競プロ紹介 27
• ユーザ特徴
– 再購買率
– 訪問曜日割合
– ジャンル購買割合
– 来店間隔
– 最終来店からの日数
• 商品特徴
– 再購買率
– 曜日割合
• ユーザ×商品特徴
– ユーザ購買間隔
– 過去購買数
– 来訪時購買割合
– 購買間隔
– 過去購買日からの日数
– 同一カテゴリ購入からの日数
https://github.com/tkm2261/kaggle_instacart/blob/master/sql/
SQLは楽に分散大規模にデータを扱えるのでオススメ
F1 score最大化
ユーザに商品を推薦するタスクなので、スコアの足切が必要
2017/11/22Kaggle&競プロ紹介 28
引用元: Ye, N., Chai, K., Lee, W., and Chieu, H. Optimizing F-measures: A Tale of Two
Approaches. In ICML, 2012.
ICML2012の関連研究がFaronさんによって共有されて
皆のスコアが爆上がり
The 3rd Place Solution
2017/11/22Kaggle&競プロ紹介 29
• この人はほぼDNNだけで特徴を作成して3位
• 購買時系列に対してLSTMとWaveNetを適用
• TensorFlowで読み難いですが学習オススメ
• 私はKerasに移植して使用中
Kaggleで上位を狙うには
• 最低限の機械学習知識
– Cross Validationや評価関数
– 有名学習器の概要やハイパーパラメタ
• データに向き合う
– GBDTの登場やスタッキング等の技術が共有されて、
近年モデル面ではほぼ差がつかない
– 大差がある場合は特徴に気づけていないので頑張る
– あらゆる角度からデータを眺める
• 長期戦を意識する
– 大体3ヵ月戦うので、結構再現性を失う
– コード管理や品質に気を配る
– 根を詰めすぎずに楽しむ
2017/11/22Kaggle&競プロ紹介 30
そもそも始め方がわからない人には。。。
2017/11/22Kaggle&競プロ紹介 31
Kaggle入門動画作ったから見てね
https://youtu.be/NHQTw-ORcSQ
Kaggler Slackもあるよ
2017/11/22Kaggle&競プロ紹介 32
https://kaggler-ja.herokuapp.com/
おっさんからのアドバイス
• 経営工学みたいなチャラい字面の学部出身のエンジニアは
どこかで身の証を立てる必要がある
– Kaggleや競技プログラミング等
• ハッタリでOK。それで仕事とって経験積ば勝ち
– 文系ウェーイ勢と同じ仕事をしますか?
– メーカーに入っても生産管理系は閑職だったりする
• 国際学会に投稿しよう
– 経営工で取れるMEngはMSと異なり、研究能力があるとみなされない
– リジェクトされてもarXivにあげておけば、
『英語でResearch活動が出来る』証明になり学位よりも役立つ
– Kaggleもいいけど大学にいる間は研究のほうがコスパ高い
• 英語をやろう
– 年収が倍になる
– 上達に時間がかかるので早いうちから
– とりあえずTOEFLかIELTSを受けよう
2017/11/22Kaggle&競プロ紹介 33
競技プログラミングの紹介
私は初心者ですが、前職は競プロガチ勢が多かったので紹介
2017/11/22Kaggle&競プロ紹介 34
• TopCoder
– 言わずと知れた有名所
– TopCoder SRMに参加してスコアが上下
– ただし近年活動が停滞しており、存在が危ぶまれている
• Codeforces
– ロシアの競技プロサイト
– 現状一番有名なのでとりあえず始めるならここ
– 2週間に一回ぐらいで2時間ぐらいのコンテストが開催
• AtCoder
– 日本の競技プロサイト
– 日本語なのとサイトが安定
• Google Code Jam
• CS Academy
• CodeChef
• Yukicoder
競プロの種類
• 普通のコンテスト
– 1~2時間で3~5問ぐらいを解く
– 速く解くほど高得点
– DFS, BFS, DP, Queue, Stuck, Priority Queue, BTree等の
アルゴリズムやデータ構造に詳しくなれる
– 最初は『for文使える?』 ぐらいの難易度で始まるので安心
• マラソンマッチ
– 数週間で問題のスコアを競う (ゲームAIを作る等)
– 長期間戦うのでクラス設計なども重要
– 最適化の研究室にいるなら挑戦してみてはどうか
2017/11/22Kaggle&競プロ紹介 35
おわり
2017/11/22Kaggle&競プロ紹介 36
https://www.slideshare.net/OwenZhang2/tips-for-data-science-competitions
Owen Zhang氏の資料より金言

More Related Content

What's hot

[DL輪読会]ドメイン転移と不変表現に関するサーベイ
[DL輪読会]ドメイン転移と不変表現に関するサーベイ[DL輪読会]ドメイン転移と不変表現に関するサーベイ
[DL輪読会]ドメイン転移と不変表現に関するサーベイDeep Learning JP
 
【DL輪読会】マルチモーダル 基盤モデル
【DL輪読会】マルチモーダル 基盤モデル【DL輪読会】マルチモーダル 基盤モデル
【DL輪読会】マルチモーダル 基盤モデルDeep Learning JP
 
SSII2021 [TS2] 深層強化学習 〜 強化学習の基礎から応用まで 〜
SSII2021 [TS2] 深層強化学習 〜 強化学習の基礎から応用まで 〜SSII2021 [TS2] 深層強化学習 〜 強化学習の基礎から応用まで 〜
SSII2021 [TS2] 深層強化学習 〜 強化学習の基礎から応用まで 〜SSII
 
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)Shota Imai
 
【論文紹介】How Powerful are Graph Neural Networks?
【論文紹介】How Powerful are Graph Neural Networks?【論文紹介】How Powerful are Graph Neural Networks?
【論文紹介】How Powerful are Graph Neural Networks?Masanao Ochi
 
方策勾配型強化学習の基礎と応用
方策勾配型強化学習の基礎と応用方策勾配型強化学習の基礎と応用
方策勾配型強化学習の基礎と応用Ryo Iwaki
 
PyTorchLightning ベース Hydra+MLFlow+Optuna による機械学習開発環境の構築
PyTorchLightning ベース Hydra+MLFlow+Optuna による機械学習開発環境の構築PyTorchLightning ベース Hydra+MLFlow+Optuna による機械学習開発環境の構築
PyTorchLightning ベース Hydra+MLFlow+Optuna による機械学習開発環境の構築Kosuke Shinoda
 
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion  for Generation and Editing[DL輪読会]GLIDE: Guided Language to Image Diffusion  for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and EditingDeep Learning JP
 
最適輸送の解き方
最適輸送の解き方最適輸送の解き方
最適輸送の解き方joisino
 
GAN(と強化学習との関係)
GAN(と強化学習との関係)GAN(と強化学習との関係)
GAN(と強化学習との関係)Masahiro Suzuki
 
パターン認識と機械学習入門
パターン認識と機械学習入門パターン認識と機械学習入門
パターン認識と機械学習入門Momoko Hayamizu
 
報酬設計と逆強化学習
報酬設計と逆強化学習報酬設計と逆強化学習
報酬設計と逆強化学習Yusuke Nakata
 
pymcとpystanでベイズ推定してみた話
pymcとpystanでベイズ推定してみた話pymcとpystanでベイズ推定してみた話
pymcとpystanでベイズ推定してみた話Classi.corp
 
[DL輪読会]“SimPLe”,“Improved Dynamics Model”,“PlaNet” 近年のVAEベース系列モデルの進展とそのモデルベース...
[DL輪読会]“SimPLe”,“Improved Dynamics Model”,“PlaNet” 近年のVAEベース系列モデルの進展とそのモデルベース...[DL輪読会]“SimPLe”,“Improved Dynamics Model”,“PlaNet” 近年のVAEベース系列モデルの進展とそのモデルベース...
[DL輪読会]“SimPLe”,“Improved Dynamics Model”,“PlaNet” 近年のVAEベース系列モデルの進展とそのモデルベース...Deep Learning JP
 
畳み込みLstm
畳み込みLstm畳み込みLstm
畳み込みLstmtak9029
 
最近強化学習の良記事がたくさん出てきたので勉強しながらまとめた
最近強化学習の良記事がたくさん出てきたので勉強しながらまとめた最近強化学習の良記事がたくさん出てきたので勉強しながらまとめた
最近強化学習の良記事がたくさん出てきたので勉強しながらまとめたKatsuya Ito
 
Graph Neural Networks
Graph Neural NetworksGraph Neural Networks
Graph Neural Networkstm1966
 
強化学習アルゴリズムPPOの解説と実験
強化学習アルゴリズムPPOの解説と実験強化学習アルゴリズムPPOの解説と実験
強化学習アルゴリズムPPOの解説と実験克海 納谷
 
【DL輪読会】"Masked Siamese Networks for Label-Efficient Learning"
【DL輪読会】"Masked Siamese Networks for Label-Efficient Learning"【DL輪読会】"Masked Siamese Networks for Label-Efficient Learning"
【DL輪読会】"Masked Siamese Networks for Label-Efficient Learning"Deep Learning JP
 

What's hot (20)

[DL輪読会]ドメイン転移と不変表現に関するサーベイ
[DL輪読会]ドメイン転移と不変表現に関するサーベイ[DL輪読会]ドメイン転移と不変表現に関するサーベイ
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
 
【DL輪読会】マルチモーダル 基盤モデル
【DL輪読会】マルチモーダル 基盤モデル【DL輪読会】マルチモーダル 基盤モデル
【DL輪読会】マルチモーダル 基盤モデル
 
SSII2021 [TS2] 深層強化学習 〜 強化学習の基礎から応用まで 〜
SSII2021 [TS2] 深層強化学習 〜 強化学習の基礎から応用まで 〜SSII2021 [TS2] 深層強化学習 〜 強化学習の基礎から応用まで 〜
SSII2021 [TS2] 深層強化学習 〜 強化学習の基礎から応用まで 〜
 
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
 
【論文紹介】How Powerful are Graph Neural Networks?
【論文紹介】How Powerful are Graph Neural Networks?【論文紹介】How Powerful are Graph Neural Networks?
【論文紹介】How Powerful are Graph Neural Networks?
 
方策勾配型強化学習の基礎と応用
方策勾配型強化学習の基礎と応用方策勾配型強化学習の基礎と応用
方策勾配型強化学習の基礎と応用
 
PyTorchLightning ベース Hydra+MLFlow+Optuna による機械学習開発環境の構築
PyTorchLightning ベース Hydra+MLFlow+Optuna による機械学習開発環境の構築PyTorchLightning ベース Hydra+MLFlow+Optuna による機械学習開発環境の構築
PyTorchLightning ベース Hydra+MLFlow+Optuna による機械学習開発環境の構築
 
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion  for Generation and Editing[DL輪読会]GLIDE: Guided Language to Image Diffusion  for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
 
最適輸送の解き方
最適輸送の解き方最適輸送の解き方
最適輸送の解き方
 
GAN(と強化学習との関係)
GAN(と強化学習との関係)GAN(と強化学習との関係)
GAN(と強化学習との関係)
 
パターン認識と機械学習入門
パターン認識と機械学習入門パターン認識と機械学習入門
パターン認識と機械学習入門
 
報酬設計と逆強化学習
報酬設計と逆強化学習報酬設計と逆強化学習
報酬設計と逆強化学習
 
pymcとpystanでベイズ推定してみた話
pymcとpystanでベイズ推定してみた話pymcとpystanでベイズ推定してみた話
pymcとpystanでベイズ推定してみた話
 
[DL輪読会]“SimPLe”,“Improved Dynamics Model”,“PlaNet” 近年のVAEベース系列モデルの進展とそのモデルベース...
[DL輪読会]“SimPLe”,“Improved Dynamics Model”,“PlaNet” 近年のVAEベース系列モデルの進展とそのモデルベース...[DL輪読会]“SimPLe”,“Improved Dynamics Model”,“PlaNet” 近年のVAEベース系列モデルの進展とそのモデルベース...
[DL輪読会]“SimPLe”,“Improved Dynamics Model”,“PlaNet” 近年のVAEベース系列モデルの進展とそのモデルベース...
 
研究効率化Tips Ver.2
研究効率化Tips Ver.2研究効率化Tips Ver.2
研究効率化Tips Ver.2
 
畳み込みLstm
畳み込みLstm畳み込みLstm
畳み込みLstm
 
最近強化学習の良記事がたくさん出てきたので勉強しながらまとめた
最近強化学習の良記事がたくさん出てきたので勉強しながらまとめた最近強化学習の良記事がたくさん出てきたので勉強しながらまとめた
最近強化学習の良記事がたくさん出てきたので勉強しながらまとめた
 
Graph Neural Networks
Graph Neural NetworksGraph Neural Networks
Graph Neural Networks
 
強化学習アルゴリズムPPOの解説と実験
強化学習アルゴリズムPPOの解説と実験強化学習アルゴリズムPPOの解説と実験
強化学習アルゴリズムPPOの解説と実験
 
【DL輪読会】"Masked Siamese Networks for Label-Efficient Learning"
【DL輪読会】"Masked Siamese Networks for Label-Efficient Learning"【DL輪読会】"Masked Siamese Networks for Label-Efficient Learning"
【DL輪読会】"Masked Siamese Networks for Label-Efficient Learning"
 

Similar to Kaggle&競プロ紹介 in 中田研究室

NIPS2017読み会 LightGBM: A Highly Efficient Gradient Boosting Decision Tree
NIPS2017読み会 LightGBM: A Highly Efficient Gradient Boosting Decision TreeNIPS2017読み会 LightGBM: A Highly Efficient Gradient Boosting Decision Tree
NIPS2017読み会 LightGBM: A Highly Efficient Gradient Boosting Decision TreeTakami Sato
 
参加したセッションの ピックアップ
参加したセッションのピックアップ参加したセッションのピックアップ
参加したセッションの ピックアップ健一 辰濱
 
Groovy Grails eXchage 2014 報告
Groovy Grails eXchage 2014 報告Groovy Grails eXchage 2014 報告
Groovy Grails eXchage 2014 報告Tsuyoshi Yamamoto
 
LightGBMを少し改造してみた ~カテゴリ変数の動的エンコード~
LightGBMを少し改造してみた ~カテゴリ変数の動的エンコード~LightGBMを少し改造してみた ~カテゴリ変数の動的エンコード~
LightGBMを少し改造してみた ~カテゴリ変数の動的エンコード~RyuichiKanoh
 
KubeFlow MeetUp #1 Katibよもやま話
KubeFlow MeetUp #1 Katibよもやま話KubeFlow MeetUp #1 Katibよもやま話
KubeFlow MeetUp #1 Katibよもやま話Yuji Oshima
 
PySpark Intro Part.2 with SQL Graph
PySpark Intro Part.2 with SQL GraphPySpark Intro Part.2 with SQL Graph
PySpark Intro Part.2 with SQL GraphOshitari_kochi
 
Chainer Contribution Guide
Chainer Contribution GuideChainer Contribution Guide
Chainer Contribution GuideKenta Oono
 
Functional Programming in Scala Reading #2
Functional Programming in Scala Reading #2Functional Programming in Scala Reading #2
Functional Programming in Scala Reading #2Naoyuki Yamada
 
Quick Overview of Upcoming Spark 3.0 + α
Quick Overview of Upcoming Spark 3.0 + αQuick Overview of Upcoming Spark 3.0 + α
Quick Overview of Upcoming Spark 3.0 + αTakeshi Yamamuro
 
「GebとSpockではじめるシステムテスト自動化」
「GebとSpockではじめるシステムテスト自動化」「GebとSpockではじめるシステムテスト自動化」
「GebとSpockではじめるシステムテスト自動化」Hiroyuki Ohnaka
 
データプロダクトを支えるビッグデータ基盤
データプロダクトを支えるビッグデータ基盤データプロダクトを支えるビッグデータ基盤
データプロダクトを支えるビッグデータ基盤Google Cloud Platform - Japan
 
20160728 hyperscale #03
20160728 hyperscale #0320160728 hyperscale #03
20160728 hyperscale #03ManaMurakami1
 
SQLおじさん(自称)がBigQueryのStandard SQLを使ってみた
SQLおじさん(自称)がBigQueryのStandard SQLを使ってみたSQLおじさん(自称)がBigQueryのStandard SQLを使ってみた
SQLおじさん(自称)がBigQueryのStandard SQLを使ってみたKumano Ryo
 
20180628 chainer on_colaboratory
20180628 chainer on_colaboratory20180628 chainer on_colaboratory
20180628 chainer on_colaboratoryKeisuke Umezawa
 
Chainerを使ってプロダクション環境上で推論するには
Chainerを使ってプロダクション環境上で推論するにはChainerを使ってプロダクション環境上で推論するには
Chainerを使ってプロダクション環境上で推論するにはKeisuke Umezawa
 
PTLのお仕事とリリースパイプラインの裏側
PTLのお仕事とリリースパイプラインの裏側PTLのお仕事とリリースパイプラインの裏側
PTLのお仕事とリリースパイプラインの裏側masahito12
 
Cryogenでサイトつくろーじぇん
CryogenでサイトつくろーじぇんCryogenでサイトつくろーじぇん
CryogenでサイトつくろーじぇんKazuhiro Hara
 

Similar to Kaggle&競プロ紹介 in 中田研究室 (20)

NIPS2017読み会 LightGBM: A Highly Efficient Gradient Boosting Decision Tree
NIPS2017読み会 LightGBM: A Highly Efficient Gradient Boosting Decision TreeNIPS2017読み会 LightGBM: A Highly Efficient Gradient Boosting Decision Tree
NIPS2017読み会 LightGBM: A Highly Efficient Gradient Boosting Decision Tree
 
参加したセッションの ピックアップ
参加したセッションのピックアップ参加したセッションのピックアップ
参加したセッションの ピックアップ
 
Groovy Grails eXchage 2014 報告
Groovy Grails eXchage 2014 報告Groovy Grails eXchage 2014 報告
Groovy Grails eXchage 2014 報告
 
2018 07-23
2018 07-232018 07-23
2018 07-23
 
LightGBMを少し改造してみた ~カテゴリ変数の動的エンコード~
LightGBMを少し改造してみた ~カテゴリ変数の動的エンコード~LightGBMを少し改造してみた ~カテゴリ変数の動的エンコード~
LightGBMを少し改造してみた ~カテゴリ変数の動的エンコード~
 
KubeFlow MeetUp #1 Katibよもやま話
KubeFlow MeetUp #1 Katibよもやま話KubeFlow MeetUp #1 Katibよもやま話
KubeFlow MeetUp #1 Katibよもやま話
 
PySpark Intro Part.2 with SQL Graph
PySpark Intro Part.2 with SQL GraphPySpark Intro Part.2 with SQL Graph
PySpark Intro Part.2 with SQL Graph
 
Chainer Contribution Guide
Chainer Contribution GuideChainer Contribution Guide
Chainer Contribution Guide
 
Functional Programming in Scala Reading #2
Functional Programming in Scala Reading #2Functional Programming in Scala Reading #2
Functional Programming in Scala Reading #2
 
Quick Overview of Upcoming Spark 3.0 + α
Quick Overview of Upcoming Spark 3.0 + αQuick Overview of Upcoming Spark 3.0 + α
Quick Overview of Upcoming Spark 3.0 + α
 
Katib
KatibKatib
Katib
 
「GebとSpockではじめるシステムテスト自動化」
「GebとSpockではじめるシステムテスト自動化」「GebとSpockではじめるシステムテスト自動化」
「GebとSpockではじめるシステムテスト自動化」
 
データプロダクトを支えるビッグデータ基盤
データプロダクトを支えるビッグデータ基盤データプロダクトを支えるビッグデータ基盤
データプロダクトを支えるビッグデータ基盤
 
20160728 hyperscale #03
20160728 hyperscale #0320160728 hyperscale #03
20160728 hyperscale #03
 
SQLおじさん(自称)がBigQueryのStandard SQLを使ってみた
SQLおじさん(自称)がBigQueryのStandard SQLを使ってみたSQLおじさん(自称)がBigQueryのStandard SQLを使ってみた
SQLおじさん(自称)がBigQueryのStandard SQLを使ってみた
 
20180628 chainer on_colaboratory
20180628 chainer on_colaboratory20180628 chainer on_colaboratory
20180628 chainer on_colaboratory
 
RgGen ご紹介
RgGen ご紹介RgGen ご紹介
RgGen ご紹介
 
Chainerを使ってプロダクション環境上で推論するには
Chainerを使ってプロダクション環境上で推論するにはChainerを使ってプロダクション環境上で推論するには
Chainerを使ってプロダクション環境上で推論するには
 
PTLのお仕事とリリースパイプラインの裏側
PTLのお仕事とリリースパイプラインの裏側PTLのお仕事とリリースパイプラインの裏側
PTLのお仕事とリリースパイプラインの裏側
 
Cryogenでサイトつくろーじぇん
CryogenでサイトつくろーじぇんCryogenでサイトつくろーじぇん
Cryogenでサイトつくろーじぇん
 

More from Takami Sato

Kaggle Santa 2019で学ぶMIP最適化入門
Kaggle Santa 2019で学ぶMIP最適化入門Kaggle Santa 2019で学ぶMIP最適化入門
Kaggle Santa 2019で学ぶMIP最適化入門Takami Sato
 
Quoraコンペ参加記録
Quoraコンペ参加記録Quoraコンペ参加記録
Quoraコンペ参加記録Takami Sato
 
Data Science Bowl 2017 Winning Solutions Survey
Data Science Bowl 2017Winning Solutions SurveyData Science Bowl 2017Winning Solutions Survey
Data Science Bowl 2017 Winning Solutions SurveyTakami Sato
 
NIPS2016論文紹介 Riemannian SVRG fast stochastic optimization on riemannian manif...
NIPS2016論文紹介 Riemannian SVRG fast stochastic optimization on riemannian manif...NIPS2016論文紹介 Riemannian SVRG fast stochastic optimization on riemannian manif...
NIPS2016論文紹介 Riemannian SVRG fast stochastic optimization on riemannian manif...Takami Sato
 
Overview of tree algorithms from decision tree to xgboost
Overview of tree algorithms from decision tree to xgboostOverview of tree algorithms from decision tree to xgboost
Overview of tree algorithms from decision tree to xgboostTakami Sato
 
Icml2015 論文紹介 sparse_subspace_clustering_with_missing_entries
Icml2015 論文紹介 sparse_subspace_clustering_with_missing_entriesIcml2015 論文紹介 sparse_subspace_clustering_with_missing_entries
Icml2015 論文紹介 sparse_subspace_clustering_with_missing_entriesTakami Sato
 
AAをつくろう!
AAをつくろう!AAをつくろう!
AAをつくろう!Takami Sato
 
High performance python computing for data science
High performance python computing for data scienceHigh performance python computing for data science
High performance python computing for data scienceTakami Sato
 
Scikit learnで学ぶ機械学習入門
Scikit learnで学ぶ機械学習入門Scikit learnで学ぶ機械学習入門
Scikit learnで学ぶ機械学習入門Takami Sato
 
最適化超入門
最適化超入門最適化超入門
最適化超入門Takami Sato
 
Word2vecで大谷翔平の二刀流論争に終止符を打つ!
Word2vecで大谷翔平の二刀流論争に終止符を打つ!Word2vecで大谷翔平の二刀流論争に終止符を打つ!
Word2vecで大谷翔平の二刀流論争に終止符を打つ!Takami Sato
 
セクシー女優で学ぶ画像分類入門
セクシー女優で学ぶ画像分類入門セクシー女優で学ぶ画像分類入門
セクシー女優で学ぶ画像分類入門Takami Sato
 

More from Takami Sato (12)

Kaggle Santa 2019で学ぶMIP最適化入門
Kaggle Santa 2019で学ぶMIP最適化入門Kaggle Santa 2019で学ぶMIP最適化入門
Kaggle Santa 2019で学ぶMIP最適化入門
 
Quoraコンペ参加記録
Quoraコンペ参加記録Quoraコンペ参加記録
Quoraコンペ参加記録
 
Data Science Bowl 2017 Winning Solutions Survey
Data Science Bowl 2017Winning Solutions SurveyData Science Bowl 2017Winning Solutions Survey
Data Science Bowl 2017 Winning Solutions Survey
 
NIPS2016論文紹介 Riemannian SVRG fast stochastic optimization on riemannian manif...
NIPS2016論文紹介 Riemannian SVRG fast stochastic optimization on riemannian manif...NIPS2016論文紹介 Riemannian SVRG fast stochastic optimization on riemannian manif...
NIPS2016論文紹介 Riemannian SVRG fast stochastic optimization on riemannian manif...
 
Overview of tree algorithms from decision tree to xgboost
Overview of tree algorithms from decision tree to xgboostOverview of tree algorithms from decision tree to xgboost
Overview of tree algorithms from decision tree to xgboost
 
Icml2015 論文紹介 sparse_subspace_clustering_with_missing_entries
Icml2015 論文紹介 sparse_subspace_clustering_with_missing_entriesIcml2015 論文紹介 sparse_subspace_clustering_with_missing_entries
Icml2015 論文紹介 sparse_subspace_clustering_with_missing_entries
 
AAをつくろう!
AAをつくろう!AAをつくろう!
AAをつくろう!
 
High performance python computing for data science
High performance python computing for data scienceHigh performance python computing for data science
High performance python computing for data science
 
Scikit learnで学ぶ機械学習入門
Scikit learnで学ぶ機械学習入門Scikit learnで学ぶ機械学習入門
Scikit learnで学ぶ機械学習入門
 
最適化超入門
最適化超入門最適化超入門
最適化超入門
 
Word2vecで大谷翔平の二刀流論争に終止符を打つ!
Word2vecで大谷翔平の二刀流論争に終止符を打つ!Word2vecで大谷翔平の二刀流論争に終止符を打つ!
Word2vecで大谷翔平の二刀流論争に終止符を打つ!
 
セクシー女優で学ぶ画像分類入門
セクシー女優で学ぶ画像分類入門セクシー女優で学ぶ画像分類入門
セクシー女優で学ぶ画像分類入門
 

Kaggle&競プロ紹介 in 中田研究室