Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

最近のディープラーニングのトレンド紹介_20200925

・自己教師あり学習
・半教師あり学習
・転移学習
・メタ学習
・模倣学習
・逆強化学習
・能動学習(Active Learning)

について
「概要」、「代表的アルゴリズム名」、
「各内容を学ぶためのおすすめチュートリアル動画」を解説しています

2020年9月25日
理系ナビ DLエンジニアトレーニングプログラム

  • Be the first to comment

最近のディープラーニングのトレンド紹介_20200925

  1. 1. ディープラーニングのトレンドや課題 (※本スライドは公開されます) 電通国際情報サービス(ISID) X(クロス)イノベーション本部 AIテクノロジー部 AIトランスフォーメーションセンター 小川 雄太郎 理系ナビ DLエンジニアトレーニングプログラム(2020年9月25日)
  2. 2. 2 https://isid-ai.jp/ 電通国際情報サービス(ISID) AIトランスフォーメーションセンター
  3. 3. 3 本日の内容 1:自己紹介 2:DLのトレンド 3:DLの課題 4:DLの国際情勢・日本のプレゼンス 5:さいごに
  4. 4. 4 自己紹介01
  5. 5. 5 小川 雄太郎 出身:兵庫県 西宮市 経歴:理論神経科学の分野で博士号を取得、ポスドク後、ISIDに入社 業務:AI製品の開発と、様々な業界の企業様のAI系IT案件のリード 兼職:日本ディープラーニング協会 委員(G検定・E資格等の推進) 、 早稲田大学 非常勤講師、執筆 出版: 詳細:https://github.com/YutaroOgawa/about_me Twitter:https://twitter.com/ISID_AI_team
  6. 6. 6 DLのトレンド02
  7. 7. 7 DLのトレンド まずは、DLの基本的な技術にふれ、遊んでみましょう
  8. 8. 8 DLのトレンド [1] デモページの最下部「MNIST」で手書き文字の認識 [2] デモページの上から3番目「Yolo」で自分のローカルにある画像をアップロード を試してみてください https://microsoft.github.io/onnxjs-demo/#/ まずは、DLの基本的な技術にふれ、遊んでみましょう
  9. 9. 9 DLのトレンド 以上、簡単に画像分類、物体認識を体験していただきました 続いて、このような簡単なディープラーニング技術からどんどん進化している、 「最近のディープラーニング周りのトレンド」※ について解説します ※ 私の私見であり、専門家によって認識は異なります
  10. 10. 10 DLのトレンド そもそもトレンド情報の調べ方 Twitter、Qiita、Medium等で気になる人をフォローしたり、記事検索1 メルマガで毎週のトピックを収集(以下3つで十分) ・[日本語] Weekly Machine Learning:https://www.getrevue.co/profile/icoxfog417/ ・[日本語] Weekly Kaggle News: https://www.getrevue.co/profile/upura ・[英語] Deep Learning Weekly: https://www.deeplearningweekly.com/ 2 学会参加や論文(arXiv)での新発表を追う ・Arxiv Sanityのtop recentを確認: http://www.arxiv-sanity.com/top ・Papers With Codeを確認: https://paperswithcode.com/ 3 ベンダーのカンファレンス(Microsoft Build等)、Gartner(ガートナー)など リサーチ会社のレポート、日経xTechなどの技術雑誌 4
  11. 11. 11 DLのトレンド 画像系 引用: https://paperswithcode.com/ Paper with Codeで、トレンドやSOTA論文(state of the art≒最高性能)を確かめる
  12. 12. 12 DLのトレンド 画像系 引用: https://paperswithcode.com/ Paper with CodeのBrowse State-of-the-Artで最近の状況を調べる (タスクごとに整理されています)
  13. 13. 13 DLのトレンド 画像系 引用: https://paperswithcode.com/sota/image-classification-on-imagenet ImageNetの場合
  14. 14. 14 DLのトレンド 画像系 引用: https://paperswithcode.com/paper/fixing-the-train-test-resolution-discrepancy-2 ImageNetの場合 ①論文へ ②実装の GitHubへ ③実装のフレームワーク ↓④下に続く
  15. 15. 15 DLのトレンド 画像系 引用: https://paperswithcode.com/paper/fixing-the-train-test-resolution-discrepancy-2 ImageNetの場合 ⑤ここを見れば 実装に使われて いる技術が、 大まかに分かる ⑥クリック
  16. 16. 16 DLのトレンド 画像系 引用: https://paperswithcode.com/method/1x1-convolution ImageNetの場合 ⑦DLのモデル実装 時の使われる要素技 術が個々に解説され ている
  17. 17. 17 DLのトレンド 自然言語処理系 引用: https://www.itmedia.co.jp/news/articles/1910/27/news014.html 19年10月末、Googleは検索エンジン(英語版)に、意図をくんで答えるBERTと呼ばれるDLを導入
  18. 18. 18 DLのトレンド 自然言語処理系 引用: https://www.itmedia.co.jp/news/articles/1910/27/news014.html BERTの性質とは? 例えば、以下の3つの文章があるとします。 ①昨日、会社をくびになった。 ②昨日、たくさん運動して、くびと脚が筋肉痛だ。 ③先日、やらかしてしまい、会社を解雇された。 このときBERTは、文章①のくびは、②のくび、よりも、③の解雇、に意味が近い、 という文脈の意図を組むことができるAIエンジンです。同音異義語に強い。 BERTにより曖昧な検索クエリでも文章を検索したり、文書同士の類似性を比較しやすくなります
  19. 19. 19 DLのトレンド 自然言語処理系 BERTの構造は? [1] それまで自然言語処理系ではRNN(リカレントニューラルネットワーク)、 LSTMやGRU(Gated Recurrent Unit)がベースネットワークに使われてきた [2] BERTの出現で「Self-Attentionによる重み付けフィルタ」のモジュール、 Transformerが有用となった ※BERTではTransformerがベース ※Self-AttentionネットワークはCNNやRNNのような感じで、SANと呼ばれます [3] 英語圏では近年、人が書いたのかAIが書いたのか、もう見分けがつかない文章を 作れる自然言語処理モデル(GPT、GPT-2、GPT-3)が構築された。これらもSAN のトランスフォーマーベース。 [4] とはいえ、RNN系の勉強の意味がないわけではないので注意!
  20. 20. 20 DLのトレンド 新たな学習概念の登場 引用: https://active.nikkeibp.co.jp/atcl/act/19/00140/030200004/ ※無料公開範囲の画像。教育的使用。
  21. 21. 21 DLのトレンド 新たな学習概念の登場 引用: https://active.nikkeibp.co.jp/atcl/act/19/00140/030200004/ [1] 自己教師あり学習 (Self-Surpervied Learning) 教師あり学習の主にクラス分類問題で、アノテー ションした教師データを使わずに解く手法 (例) Deep Cluster、SeLa SimCLR:Simple Framework for Contrastive Learning of Visual Representations(ヒントンら) BYOL: Bootstrap Your Own Latent (DeepMind) SwAV:Swapping Assignments between Views (FAIR:Facebook AI Research)
  22. 22. 22 DLのトレンド [1] 自己教師あり学習のトレンド:ImageNetでTop1が80%弱。ResNet-101くらい≒人レベル 引用: https://paperswithcode.com/sota/self-supervised-image-classification-on
  23. 23. 23 DLのトレンド [1] 自己教師あり学習: ICML 2019 Tutorialがおすすめ 引用: https://sites.google.com/view/self-supervised-icml2019 https://icml.cc/Conferences/2019/ScheduleMultitrack?event=3527
  24. 24. 24 DLのトレンド 新たな学習概念の登場 引用: https://active.nikkeibp.co.jp/atcl/act/19/00140/030200004/ [2] 半教師あり学習 (Semi-Surpervied Learning) 教師あり学習の主にクラス分類問題で、アノテー ションした教師データを少しだけ用意して解く手 法 (例) MixMatch UDA :Unsupervised Data Augmentation S4L:Self-Supervised Semi-Supervised Learning(Google) SimCLR:Simple Framework for Contrastive Learning of Visual Representations(ヒントンら) (※自己教師あり学習でも使用したモデル)
  25. 25. 25 DLのトレンド [2] 半教師あり学習のトレンド:ImageNetで教師データは10%。それでTop1が80%超えは、 ResNeXt-101くらい≒人超えレベル (ResNeXtはResNetのresidualブロックを並列化) 引用: https://paperswithcode.com/sota/self-supervised-image-classification-on
  26. 26. 26 DLのトレンド [2] 半教師あり学習:CVPR 2018 TutorialとECCV 2020 Tutorialがおすすめ 引用: https://hbilen.github.io/wsl-cvpr18.github.io/ https://www.youtube.com/watch?v=bXfZFmE8cjo https://www.youtube.com/watch?v=FetNp6f19IM https://hbilen.github.io/wsl-eccv20.github.io/
  27. 27. 27 DLのトレンド 新たな学習概念の登場 引用: https://active.nikkeibp.co.jp/atcl/act/19/00140/030200004/ [3] 転移学習 (Transfer Learning) 特定のデータセットやタスクで学習したDLネット ワークの重みを、別タスクの初期値に利用するこ とで、小さな訓練データセットでも性能を出す手 法。画像の場合は昔から一般的だったが自然言語 処理や強化学習でもできるようになってきた。 (例) BERT(自然言語処理) 深層強化学習 ・reward shaping approach ・demonstration approach ・policy transfer approach ・inter-task mapping approach ・transfer representation
  28. 28. 28 DLのトレンド [3] 転移学習(深層強化学習):2020年9月16日のこのレビュー論文が網羅的でおすすめです 引用: https://arxiv.org/abs/2009.07888
  29. 29. 29 DLのトレンド 新たな学習概念の登場 引用: https://active.nikkeibp.co.jp/atcl/act/19/00140/030200004/ [4] メタ学習 (Meta Learning) 複数のタスク(やデータセット)で学習した学習 のプロセスを別のタスクに流用する学習手法。要 はファインチューニングの一種となる。少ない新 規訓練データで学習させるので、few-shot learningやone-shot learningと関連が深い。 強化学習での使用が多い(基本行動ができる方策 ネットワークに複雑な行動を覚えさせたり、新環 境でも既存と同じ行動ができるようにする等)。 (例) MAML:Model-Agnostic Meta-Learning Neural Processes SoftModule
  30. 30. 30 DLのトレンド [4] メタ学習:2020年4月11日のこのレビュー論文と、ICML 2019 Tutorialがおすすめ 引用: https://arxiv.org/abs/2004.05439 https://sites.google.com/view/icml19metalearning
  31. 31. 31 DLのトレンド 新たな学習概念の登場 引用: https://active.nikkeibp.co.jp/atcl/act/19/00140/030200004/ [5] 模倣学習 (Imitation Learning) 強化学習において、人が例を見せて、それを参考 に方策ネットワーク(とある状況に置かれたとき、 どの行動を選択するかを決めるネットワーク)を、 を訓練する学習(≒教師あり学習的な強化学習) (例) いろいろ・・・ BC:Behavioral Cloning GAIL:Generative Adversarial Imitation Learning SAIL:Support-weightedAdversarial Imitation Learning RED:Random Expert Distillation DAC: Discriminator Actor Critic PWIL:Primal Wasserstein Imitation Learning
  32. 32. 32 DLのトレンド [5] 模倣学習:ICML 2018 Tutorialがおすすめ 引用: https://sites.google.com/view/icml2018-imitation-learning/
  33. 33. 33 DLのトレンド [5] 模倣学習:ちょっと昔の研究ですが、私が好きな研究 (サッカーで、エキスパートだったとしたらどういうポジションをとるのか示す) 引用: https://www.semanticscholar.org/paper/Data-Driven-Ghosting-using-Deep-Imitation-Learning-Le- Carr/f07d49c294754849e1dde2fb1c8f080fea60b95c https://www.youtube.com/watch?v=WI-WL2cj0CA 青■8のディフェンダーは●8の位置にいるべき
  34. 34. 34 DLのトレンド 新たな学習概念の登場 引用: https://active.nikkeibp.co.jp/atcl/act/19/00140/030200004/ [6] 逆強化学習 (Inverse Reinforcement Learning) 強化学習において、人が例を見せて、それを参考 に報酬ネットワーク(とあるに置かれたとき、ど の程度の報酬がこの先期待できるかを推定する ネットワーク)、を訓練する学習 (≒教師あり学習的な強化学習) (例) MaxEnt:Maximum Entropy Inverse RL GCL:Guided Cost Learning 上記をベースにいろいろとたくさん
  35. 35. 35 DLのトレンド [6] 逆強化学習:CVPR 2018 Tutorialがおすすめ 引用: https://people.eecs.berkeley.edu/~nrhinehart/irl_cvpr18.html
  36. 36. 36 DLのトレンド 新たな学習概念の登場 引用: https://active.nikkeibp.co.jp/atcl/act/19/00140/030200004/ etc. [7] 能動学習 (Active Learning) 教師あり学習の一種。少ない教師データからモデ ルを構築し、そのモデルでの推論結果が曖昧で、 人間の正しい答えが欲しいデータを、モデルが人 間に提示し、人間が答えとなる教師ラベルを与え る。そしてデータが追加された訓練セットでさら に良いモデルを構築、を繰り返す。アノテーショ ン作業を減らせるHuman in the loopな学習手法。 (例) GAAL:Generative Adversarial Active Learning ASAL:Adversarial Sampling for Active Learning VAAL:Variational Adversarial Active Learning LLAL:Learning Loss for Active Learning
  37. 37. 37 DLのトレンド [7] Active Learning:ICML 2019 Tutorialがおすすめ 引用: https://icml.cc/Conferences/2019/ScheduleMultitrack?event=4341 https://www.youtube.com/watch?v=_Ql5vfOPxZU
  38. 38. 38 ビジネスの文脈において 「AIって何?」という質問に答えてください ディープラーニングの最新のトレンドを追っていくには、 「深層強化学習」 と 「GAN」 を、理解・実装できないと難しいです
  39. 39. 39 ビジネスの文脈において 「AIって何?」という質問に答えてください ・E資格の講座でディープラーニング実装の基礎を学ぶ ・E資格取得する その後は興味のある発展的内容にぜひ取り組んでみてください♪
  40. 40. 40 発展的学習 引用: https://www.amazon.co.jp/s?k=%E5%B0%8F%E5%B7%9D%E9%9B%84%E5%A4%AA%E9%83%8E&__mk_ja_JP=%E3%82%AB%E3%82%BF%E3%8 2%AB%E3%83%8A&ref=nb_sb_noss_1 ● 深層強化学習は左側 ● GANやBERTなどは右側 の書籍をおすすめします♪ (拙著で申し訳ございません) ※他にもたくさん書籍はあるので、 左記の書籍のレビューで比較掲載 されている別の書籍等にも挑戦し てみてください。
  41. 41. 41 発展的学習 18年出版の書籍なのでちょっと古くなってきています(アルゴリズムに新しいのが増えてきた)
  42. 42. 42 発展的学習 最近は単純な深層強化学習であれば、GoogleのSAC(Soft Actor-Critic)がメジャー DQN(15年) 価値反復型。 Q-learningにディー プラーニングを適用 Prioritized Experience Replay(16年) 価値反復型。DQNでメモリバッファー から取り出すサンプルを効率化 Ape-X(18年) 価値反復型。Prioritized Experience Replayに、分散学習+ Dueling Network+DDQN版 R2D2(18年) 価値反復型。Recurrent Experience Replay in Distributed Reinforcement Learning。 Ape-XにRNNを追加 TRPO(15年) trust region policy optimization。 方策勾配法にエントロピー項を足して、 方策の急激な変化を防ぐ PPO(17年) Proximal Policy Optimization。方策勾配法 にクリッピングを足して、急激な変化を防ぐ。 現在スタンダードに使用されることが多い A3C、A2C(16年) Asynchronous Advantage Actor- Critic。分散学習+Advantage学習 型Actor-Critic Soft Actor-Critic (19年) Actor-Criticに方策の乱雑さの最大化も目指 させることで、ロバスト性をアップ。現在、 スタンダードに使用されることが多い。 NGU (19年) Agent57 (20年)
  43. 43. 43 ビジネスの文脈において 「AIって何?」という質問に答えてください もう少し、ビジネス寄りのDLのトレンドについて。 こちらは第3回の講演で解説します
  44. 44. 44 DLのトレンド Gartner(ガートナー):テクノロジのハイプ・サイクル:2020年 引用: https://www.gartner.com/jp/newsroom/press-releases/pr-20200819
  45. 45. 45 DLの課題03
  46. 46. 46 DLの課題 技術的課題は膨大ですが、社会的課題においては差別・人種・倫理系と暴走系がメイン 引用: https://www.itmedia.co.jp/news/articles/1910/27/news014.html https://www.slideshare.net/dahatake/the-ethics-of-ai-ai https://forbesjapan.com/articles/detail/35179 https://www.itmedia.co.jp/news/articles/2004/10/news128.html
  47. 47. 47 DLの課題 引用: https://sites.google.com/view/sac-and-applications https://www.alexirpan.com/2018/02/14/rl-hard.html https://www.alexirpan.com/public/rl-hard/upright_half_cheetah.mp4 https://www.alexirpan.com/public/rl-hard/upsidedown_half_cheetah.mp4 ●暴走系は深層強化学習と深く関連:深層強化学習ではデータを用意しなくても自ら学習できる(ア ルファ碁など)。だが、とあるシチュエーションでどう動くのか、全安全性確認のすべがない・・・ ①SACでロボットが歩き方を強化学習 ②新たな環境(坂や凸凹)にもロバスト ③SACではないが、ロボ が謎の歩き方を強化学習 技術的課題は膨大ですが、社会的課題においては差別・人種・倫理系と暴走系がメイン
  48. 48. 48 ビジネスの文脈において 「AIって何?」という質問に答えてください DLの課題は技術的にも社会的にも挙げだすとキリがない ですが、私は一番重要な課題は、 ●●だと思っています
  49. 49. 49 DLの国際情勢・日本のプレゼンス04
  50. 50. 50 DLの国際情勢・日本のプレゼンス 独立行政法人情報処理推進機構(IPA)の書籍 「AI白書2020」をご覧ください
  51. 51. 51 DLの国際情勢・日本のプレゼンス 目次詳細 https://www.ipa.go.jp/files/000080401.pdf 書籍詳細 https://www.amazon.co.jp/dp/4049110342/
  52. 52. 52 さいごに05
  53. 53. 53 (再掲)DLのトレンド そもそもトレンド情報の調べ方 Twitter、Qiita、Medium等で気になる人をフォローしたり、記事検索1 メルマガで毎週のトピックを収集(以下3つで十分) ・[日本語] Weekly Machine Learning:https://www.getrevue.co/profile/icoxfog417/ ・[日本語] Weekly Kaggle News: https://www.getrevue.co/profile/upura ・[英語] Deep Learning Weekly: https://www.deeplearningweekly.com/ 2 学会参加や論文(arXiv)での新発表を追う ・Arxiv Sanityのtop recentを確認: http://www.arxiv-sanity.com/top ・Papers With Codeを確認: https://paperswithcode.com/ 3 ベンダのカンファレンス(Microsoft Build等)、Gartner(ガートナー) などリサーチ会社のレポート、日経xTechなどの技術雑誌 4 これ
  54. 54. 54 小川の情報発信 メインの情報発信はTwitterを使用しています Qiita:https://qiita.com/sugulu_Ogawa_ISID Twitter:https://twitter.com/ISID_AI_team :https://medium.com/@yutaro.ogawa.1116 slideshare:https://www.slideshare.net/yutaroogawa1116
  55. 55. 55 ITのフルスタック能力 × AI × Biz(ビジネス)スキルでビジネスを創造できる人材へ 電通国際情報サービス(ISID) X(クロス)イノベーション本部 AIテクノロジー部での成長 UVP ・機械学習 アルゴリズム ・統計解析 ・機械学習工学 ・ディープラーニング ・Webシステム構築 ・MLOps ・データ分析基盤構築 ・IoTシステム構築 ・PM、PdM ・デザイン思考(UX/UI) ・ビジネスクリエーション (リーン, ジョブ理論, etc.) ・業界や分野の専門知識 IT技術 Biz AI/データサイエンス フロントエンド バックエンド コンテナ・仮想化 クラウド&インフラ AI/ML アジャイル開発(スクラム)
  56. 56. 56 ITのフルスタック能力 × AI × Biz(ビジネス)スキルでビジネスを創造できる人材へ 電通国際情報サービス(ISID) X(クロス)イノベーション本部 AIテクノロジー部での成長 今日の話の内容はたった、この部分だけ。 学生を卒業し、社会人になってから、 ビジネスを創っていく人材になるには、 ディープラーニングのスキルに加えて、 BizとITのスキルも磨いていきましょう UVP ・機械学習 アルゴリズム ・統計解析 ・機械学習工学 ・ディープラーニング ・Webシステム構築 ・MLOps ・データ分析基盤構築 ・IoTシステム構築 ・PM、PdM ・デザイン思考(UX/UI) ・ビジネスクリエーション (リーン, ジョブ理論, etc.) ・業界や分野の専門知識 IT技術 Biz AI/データサイエンス
  57. 57. CONFIDENTIAL 【お問い合わせ先】 ■ 株式会社 電通国際情報サービス AIトランスフォーメーションセンター https://isid-ai.jp/ ■ X(クロス)イノベーション本部 AIテクノロジー部 email: g-isid-ai@group.isid.co.jp

×