SlideShare a Scribd company logo
1 of 28
Download to read offline
論文読みメモ
Neuroscience-Inspired
Artificial Intelligence
2017/12/28 Yasunori Endo
どんなもの?
先行研究と比べてどこがすごい?
技術や手法の肝は?
どうやって有効だと検証した?
議論はある?
次に読むべき論文は?
神経科学がAIに与えた影響を、Past/Present/Future
の3つの時間軸でまとめたリサーチ論文。
ここまで詳しく調べてある論文はすごい。
新たな手法を提示する論文ではないので割愛。 いろいろあるが、特に気になるものは以降のスライド
で著者名を出しているのでそれをみるとよい
神経科学とAIの相互の連携を緊密にし “virtuous
circle” を回していこうという提案。
数々の神経科学の研究がAIに影響を与えてきた歴史が
有効性を物語っている。
読んだ論文について
• 本文書は下記論文の精読メモである
用語の定義
AI(• 人工知能): Artificial Intelligence
知的• な機械を作ろうとするあらゆる研究
機械学習•
統計•
etc.•
NS(• 神経科学): Neuroscience
• 脳の振る舞いやメカニズムに関するあらゆる研究分野
cognitive neuroscience•
systems neuroscience•
psychology•
etc.•
AIとNSの関係について
• もともとAI・NS・心理学が密接に関わっていた(50’s – 80’s)
• 双方の研究が進んでいくに連れて、分化が進んでいった
• NSを研究すると、AI研究にとって何が嬉しいのか
• 新しいアルゴリズムやアーキテクチャの発想のもととなる
• 既存のAIアーキテクチャの検証ができる
• AIが必ずしもNS的に妥当である必要はないが、一つの指標と
なる
Marr’s 3 Levels of Analysys
Marr• は脳機能を3つのレイヤーに分けて考えた
AI• の文脈では、上位2層を重視している
脳機能• のメカニズムが注目点であり、アルゴリズムレベルでわかれば
それで十分
computational level
脳はいったい何を計算しているか?
algorithmic level
具体的な計算をどのように実現しているか?
implementation level
脳の特定のアルゴリズムを物理的にどう実現しているか?
これらの in silico で
の実現を目指す
完全な脳の再現を目指す Blue Brain
プロジェクトといった例もある
論文の構成について
From NS to AI...•
The• Past: AI研究の起源を探る
The Present:• 現在のAI研究とNSとの関連とは?
The Future: NS• のもつポテンシャルとは?
From AI to NS...•
The Past
• Deep Learning
• Reinforcement Learning
The Past (1): Deep Learning
• ANN(Artificial Neural Network)は、言葉の通りNSが起源
• 1943 McCulloch et al.: ニューロンによる論理演算
• 1949 Hebb: オートエンコーダ的サムシング?
• 1958 Rosenblatt: パーセプトロン
• 1985 Rumelhart et al.: backpropagation under PDP movement
• その当時のAI研究は…
• シリアルな論理・記号処理に注力していた
• しかし、記号処理は現実の複雑な問題を対処するには不適当だった
Parallel Distributed Processing
• Proposed in 1986 by Rumelhart et al.
• 脳が確率的かつ並列に情報を処理しているという知見
• ニューロンのようなシンプルな演算ユニットを組み合わせ学習
させることで、人間の認知と振る舞いが生まれると考えた
• PDPの研究がAIに影響を与えた例は多い
• Distributed (i.e. as vectors) representation of word/sentences
• Hubel et al., 1959 視覚野V1の研究が、CNNに影響を与えた
ディープラーニングの発達とNS
NS continued inspiring AI after PDP period•
Deep Belief Network by Hinton et al.,• 2006
ImageNet dataset•
Inspired by research on human language by Deng et al.,• 2009
Invention of• “dropout” technique by Hinton et al., 2012
ポアソン• 分布的に発火するニューロンから着想を得た
Hinton• の論文にはぱっと見書いてなさそうだったけどな(๑´•.̫• `๑)
The Past (2): Reinforcement Learning
• Temporal-difference (TD) method
• 条件付け実験(パブロフの犬)と密接に関連
• AIの進歩のコアとなっている
The Present
• Attention
• Episodic Memory
• Working Memory
• Continual Learning
The Present (1): Attention
• 多くのCNNモデルが入力全体を同様に扱う一方、霊長類の視覚
は場所や物体に注目しながら扱っている
• Mninh et al., 2014: “glimpses” architecture がクラッタをう
まく処理できた
• attention メカニズムを適用することにより、複数物体認識
(Ba et al., 2015) などで単純なCNNよりも高性能を実現
Attention in memory
attention• は知覚だけでなく、脳の内部の記憶を読む際にも使
われている
このメカニズムが• 機械翻訳等に応用されている
• “DRAW” をはじめとする生成モデルにも役立っている
• “mental canvas” に、部分ごとでインクリメンタルに画像を生成する
モデル
The Present (2): Episodic Memory
• エピソード記憶は “instance-based” & “one shot” な記憶
• 海馬での記憶が “one shot” な記憶に相当
• 睡眠・休憩中に海馬から新皮質で記憶が再生され、固定される
• Favor events that lead to high levels of reinforcement
Episodic Control
• 経験に基づいた急速な振る舞いの変化
• 海馬では、rewarded action sequences can be internally
re-enacted from a rapidly updateable memory store
Episodic Memory in AI
• Deep Q Network (DQN) における “experience replay” が脳
における記憶の流れを in silico で再現している
• Replay buffer が海馬に相当
• 報酬の高いイベントを優先した experience replay がより効果的
• ディープなRLは学習が遅いという問題があったが、 episodic
control を実装することによって解決した (Blundell et al.,
2016)
• エピソード記憶的なシステムは、少ないサンプルから新しい概
念を学習できる可能性がある
The Present (3): Working Memory
作業記憶• は前頭葉とその近辺に存在し、情報を維持・操作する
能力が人間の知性の特性となっている
中央的• なコントローラと周辺のドメインに特化したメモリ領域によっ
て構成されていると考えられている
LSTM• とDNCが作業記憶に相当
LSTM: Long Short Term Memory•
DNC: Differential• Neural Computer
The Present (4): Continual Learning
• 人間を始めとする知的なエージェントは、異なる時間軸で異な
るタスクを学習し、思い出していく事が必要
• つまり、以前のタスクでの学習を忘れることなく、新しいタスクを学
習できるということ
• 以前のタスクに関する知識を守るメカニズムが見つかっている
• ANNには “catastrophic forgetting” の問題が知られていた
• EWC (Elastic Weight Consolidation) proposed by
Kirkpatrick et al., 2017, is a solution
• ネットワークの重みのうち、以前のタスクで重要な一部分を固定する
The Future
• Intuitive Understanding of the Physical World
• Efficient Learning
• Transfer Learning
• Imagination and Planning
• Virtual Brain Analytics
The Future (1): Intuitive Understanding of the Physical World
• 人間の場合、空間・数・物体感といった概念が乳児の段階にす
でによく発達する一方で、ほとんどの AI は実現できていない
• ある ANN は、個々の物体とその関係に分解することで、シー
ンを解釈することができている
• ディープなRLを用いて、子供が対話的な実験を通して常識を理
解する仮定を捉えることができた (Denil et al., 2016)
The Future (2): Efficient Learning
人間• の認知は、事前知識を元に自在に用いることで数少ない事
例から新しい概念を学習できる点が特徴としてあげられる
この• 認知機能に関する課題として Lake et al. が 2016 年に
“characters challenge” を作った
最近• の AI アルゴが、確率的モデル・ディープな生成モデルの
両面で進歩があった
The Future (3): Transfer Learning
• 人間は経験の汎化と移転にも長けている
• 車を運転できる人が、別の種類の車にも乗れるなど
• “Progressive Network” が成果を上げている (Rusu et al.,
2016)
• あるゲームに関する学習を利用して、他のゲームの学習時間を短縮
• シミュレーション環境のロボットの学習を利用して、実世界のロボッ
トの学習時間を短縮
• 移転学習の文脈で、関係性をもとに推論する能力も考えられる
• 一般的に人間がどのように高次の移転学習をしているかはわかってい
ない
The Future (4): Imagination and Planning
• 動物は将来の報酬をシミュレートして、柔軟に行動を選択する
• 内部に環境モデルを構築し、シミュレーションを行っていると考えら
れる
• 例えばラットが選択点で止まっている時に、後に通行可能な軌跡を
通っている時に観測される海馬の活動と似たような活動が観測される
• ディープな生成モデルがここでも活躍する
• 現実空間のレイアウトをもとに連続したサンプルを生成できるモデル
が提案された (Gemici et al., 2017)
• シミュレーションの結果をエージェントの行動計画に用いる手法はま
だ存在していない
• 海馬でどのように内部モデルが存在しているかはまだ不明
The Future (5): Virtual Brain Analytics
• AIシステムの “ブラックボックス” を、神経科学の手法で解明
• 単独細胞の記録、イメージング等
• 次元削減によるニューラルネットワーク(DQN)の可視化
(Zahavy et al. 2016)
From AI to NS
機械学習• の手法を用いた神経画像(fMRI/MEG)の解析
• 脳とTD学習の関連
CNN• と ventral visual stream における情報表現の関連
Backpropagation• と脳における学習の違い
フィードフォワード・フィードバックの• 対称性が脳では観測されない
• 脳は局所的な信号を用いて学習する一方、BPでは非局所的な誤差信号
を用いる
所感
• NS が AI の発展に重要な役割を果たしていることが伝わった
• AI が思いの外幅広く脳機能をカバーしつつあることがわかっ
た
• 引いている論文が非常に多く、筆者のリサーチ力がすごい
• 読むべき論文が芋づる式に見つかるので、一度読んだほうがいい
• DeepMind 強い
• 筆者を始め、引かれている論文も DeepMind 発が多かった

More Related Content

Similar to Neuroscience inspired artificial intelligence

人間の思考、機械の思考
人間の思考、機械の思考人間の思考、機械の思考
人間の思考、機械の思考maruyama097
 
ヒト並みの人工知能と現象学
ヒト並みの人工知能と現象学ヒト並みの人工知能と現象学
ヒト並みの人工知能と現象学Naoya Arakawa
 
[DL輪読会]"Improving Coherence and Consistency in Neural Sequence Models with Du...
[DL輪読会]"Improving Coherence and Consistency in Neural Sequence Models with Du...[DL輪読会]"Improving Coherence and Consistency in Neural Sequence Models with Du...
[DL輪読会]"Improving Coherence and Consistency in Neural Sequence Models with Du...Deep Learning JP
 
ICLR2018出張報告
ICLR2018出張報告ICLR2018出張報告
ICLR2018出張報告Yu Nishimura
 
Marketing v8 no intro
Marketing v8   no introMarketing v8   no intro
Marketing v8 no introEigo Takeda
 
[DL輪読会] Spectral Norm Regularization for Improving the Generalizability of De...
[DL輪読会] Spectral Norm Regularization for Improving the Generalizability of De...[DL輪読会] Spectral Norm Regularization for Improving the Generalizability of De...
[DL輪読会] Spectral Norm Regularization for Improving the Generalizability of De...Deep Learning JP
 
Paper Reading, "On Causal and Anticausal Learning", ICML-12
Paper Reading, "On Causal and Anticausal Learning", ICML-12Paper Reading, "On Causal and Anticausal Learning", ICML-12
Paper Reading, "On Causal and Anticausal Learning", ICML-12Yusuke Iwasawa
 
[卒論]眼球運動測定と眼球運動計測による問題解決プロセスの分析
[卒論]眼球運動測定と眼球運動計測による問題解決プロセスの分析[卒論]眼球運動測定と眼球運動計測による問題解決プロセスの分析
[卒論]眼球運動測定と眼球運動計測による問題解決プロセスの分析Reiji Ohkuma
 
Signal Study Session Pages
Signal Study Session PagesSignal Study Session Pages
Signal Study Session PagesMizukiShirai
 
本の紹介「絵で見てわかるITインフラの仕組み」
本の紹介「絵で見てわかるITインフラの仕組み」本の紹介「絵で見てわかるITインフラの仕組み」
本の紹介「絵で見てわかるITインフラの仕組み」Takahiko Sato
 
リスク可視化の基本的方法
リスク可視化の基本的方法リスク可視化の基本的方法
リスク可視化の基本的方法Takayuki Itoh
 
今さら聞けないITエンジニアのための人工知能
今さら聞けないITエンジニアのための人工知能今さら聞けないITエンジニアのための人工知能
今さら聞けないITエンジニアのための人工知能Keisuke Tameyasu
 
2. 技術的問題を解決する
2. 技術的問題を解決する2. 技術的問題を解決する
2. 技術的問題を解決するIDEATION JAPAN
 

Similar to Neuroscience inspired artificial intelligence (20)

人間の思考、機械の思考
人間の思考、機械の思考人間の思考、機械の思考
人間の思考、機械の思考
 
ヒト並みの人工知能と現象学
ヒト並みの人工知能と現象学ヒト並みの人工知能と現象学
ヒト並みの人工知能と現象学
 
[DL輪読会]"Improving Coherence and Consistency in Neural Sequence Models with Du...
[DL輪読会]"Improving Coherence and Consistency in Neural Sequence Models with Du...[DL輪読会]"Improving Coherence and Consistency in Neural Sequence Models with Du...
[DL輪読会]"Improving Coherence and Consistency in Neural Sequence Models with Du...
 
Dilated rnn
Dilated rnnDilated rnn
Dilated rnn
 
人工知能と社会
人工知能と社会人工知能と社会
人工知能と社会
 
全脳アーキテクチャ勉強会 第4回(山川)
全脳アーキテクチャ勉強会 第4回(山川)全脳アーキテクチャ勉強会 第4回(山川)
全脳アーキテクチャ勉強会 第4回(山川)
 
ICLR2018出張報告
ICLR2018出張報告ICLR2018出張報告
ICLR2018出張報告
 
Marketing v8 no intro
Marketing v8   no introMarketing v8   no intro
Marketing v8 no intro
 
Marketing v8
Marketing v8Marketing v8
Marketing v8
 
[DL輪読会] Spectral Norm Regularization for Improving the Generalizability of De...
[DL輪読会] Spectral Norm Regularization for Improving the Generalizability of De...[DL輪読会] Spectral Norm Regularization for Improving the Generalizability of De...
[DL輪読会] Spectral Norm Regularization for Improving the Generalizability of De...
 
Paper Reading, "On Causal and Anticausal Learning", ICML-12
Paper Reading, "On Causal and Anticausal Learning", ICML-12Paper Reading, "On Causal and Anticausal Learning", ICML-12
Paper Reading, "On Causal and Anticausal Learning", ICML-12
 
[卒論]眼球運動測定と眼球運動計測による問題解決プロセスの分析
[卒論]眼球運動測定と眼球運動計測による問題解決プロセスの分析[卒論]眼球運動測定と眼球運動計測による問題解決プロセスの分析
[卒論]眼球運動測定と眼球運動計測による問題解決プロセスの分析
 
Protocol
ProtocolProtocol
Protocol
 
SIGNAL PAGES
SIGNAL PAGESSIGNAL PAGES
SIGNAL PAGES
 
Signal Study Session Pages
Signal Study Session PagesSignal Study Session Pages
Signal Study Session Pages
 
Robotpaper.Challenge 2019-08
Robotpaper.Challenge 2019-08Robotpaper.Challenge 2019-08
Robotpaper.Challenge 2019-08
 
本の紹介「絵で見てわかるITインフラの仕組み」
本の紹介「絵で見てわかるITインフラの仕組み」本の紹介「絵で見てわかるITインフラの仕組み」
本の紹介「絵で見てわかるITインフラの仕組み」
 
リスク可視化の基本的方法
リスク可視化の基本的方法リスク可視化の基本的方法
リスク可視化の基本的方法
 
今さら聞けないITエンジニアのための人工知能
今さら聞けないITエンジニアのための人工知能今さら聞けないITエンジニアのための人工知能
今さら聞けないITエンジニアのための人工知能
 
2. 技術的問題を解決する
2. 技術的問題を解決する2. 技術的問題を解決する
2. 技術的問題を解決する
 

Recently uploaded

AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NTT DATA Technology & Innovation
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 

Recently uploaded (8)

AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 

Neuroscience inspired artificial intelligence

  • 4. 用語の定義 AI(• 人工知能): Artificial Intelligence 知的• な機械を作ろうとするあらゆる研究 機械学習• 統計• etc.• NS(• 神経科学): Neuroscience • 脳の振る舞いやメカニズムに関するあらゆる研究分野 cognitive neuroscience• systems neuroscience• psychology• etc.•
  • 5. AIとNSの関係について • もともとAI・NS・心理学が密接に関わっていた(50’s – 80’s) • 双方の研究が進んでいくに連れて、分化が進んでいった • NSを研究すると、AI研究にとって何が嬉しいのか • 新しいアルゴリズムやアーキテクチャの発想のもととなる • 既存のAIアーキテクチャの検証ができる • AIが必ずしもNS的に妥当である必要はないが、一つの指標と なる
  • 6. Marr’s 3 Levels of Analysys Marr• は脳機能を3つのレイヤーに分けて考えた AI• の文脈では、上位2層を重視している 脳機能• のメカニズムが注目点であり、アルゴリズムレベルでわかれば それで十分 computational level 脳はいったい何を計算しているか? algorithmic level 具体的な計算をどのように実現しているか? implementation level 脳の特定のアルゴリズムを物理的にどう実現しているか? これらの in silico で の実現を目指す 完全な脳の再現を目指す Blue Brain プロジェクトといった例もある
  • 7. 論文の構成について From NS to AI...• The• Past: AI研究の起源を探る The Present:• 現在のAI研究とNSとの関連とは? The Future: NS• のもつポテンシャルとは? From AI to NS...•
  • 8. The Past • Deep Learning • Reinforcement Learning
  • 9. The Past (1): Deep Learning • ANN(Artificial Neural Network)は、言葉の通りNSが起源 • 1943 McCulloch et al.: ニューロンによる論理演算 • 1949 Hebb: オートエンコーダ的サムシング? • 1958 Rosenblatt: パーセプトロン • 1985 Rumelhart et al.: backpropagation under PDP movement • その当時のAI研究は… • シリアルな論理・記号処理に注力していた • しかし、記号処理は現実の複雑な問題を対処するには不適当だった
  • 10. Parallel Distributed Processing • Proposed in 1986 by Rumelhart et al. • 脳が確率的かつ並列に情報を処理しているという知見 • ニューロンのようなシンプルな演算ユニットを組み合わせ学習 させることで、人間の認知と振る舞いが生まれると考えた • PDPの研究がAIに影響を与えた例は多い • Distributed (i.e. as vectors) representation of word/sentences • Hubel et al., 1959 視覚野V1の研究が、CNNに影響を与えた
  • 11. ディープラーニングの発達とNS NS continued inspiring AI after PDP period• Deep Belief Network by Hinton et al.,• 2006 ImageNet dataset• Inspired by research on human language by Deng et al.,• 2009 Invention of• “dropout” technique by Hinton et al., 2012 ポアソン• 分布的に発火するニューロンから着想を得た Hinton• の論文にはぱっと見書いてなさそうだったけどな(๑´•.̫• `๑)
  • 12. The Past (2): Reinforcement Learning • Temporal-difference (TD) method • 条件付け実験(パブロフの犬)と密接に関連 • AIの進歩のコアとなっている
  • 13. The Present • Attention • Episodic Memory • Working Memory • Continual Learning
  • 14. The Present (1): Attention • 多くのCNNモデルが入力全体を同様に扱う一方、霊長類の視覚 は場所や物体に注目しながら扱っている • Mninh et al., 2014: “glimpses” architecture がクラッタをう まく処理できた • attention メカニズムを適用することにより、複数物体認識 (Ba et al., 2015) などで単純なCNNよりも高性能を実現
  • 15. Attention in memory attention• は知覚だけでなく、脳の内部の記憶を読む際にも使 われている このメカニズムが• 機械翻訳等に応用されている • “DRAW” をはじめとする生成モデルにも役立っている • “mental canvas” に、部分ごとでインクリメンタルに画像を生成する モデル
  • 16. The Present (2): Episodic Memory • エピソード記憶は “instance-based” & “one shot” な記憶 • 海馬での記憶が “one shot” な記憶に相当 • 睡眠・休憩中に海馬から新皮質で記憶が再生され、固定される • Favor events that lead to high levels of reinforcement
  • 17. Episodic Control • 経験に基づいた急速な振る舞いの変化 • 海馬では、rewarded action sequences can be internally re-enacted from a rapidly updateable memory store
  • 18. Episodic Memory in AI • Deep Q Network (DQN) における “experience replay” が脳 における記憶の流れを in silico で再現している • Replay buffer が海馬に相当 • 報酬の高いイベントを優先した experience replay がより効果的 • ディープなRLは学習が遅いという問題があったが、 episodic control を実装することによって解決した (Blundell et al., 2016) • エピソード記憶的なシステムは、少ないサンプルから新しい概 念を学習できる可能性がある
  • 19. The Present (3): Working Memory 作業記憶• は前頭葉とその近辺に存在し、情報を維持・操作する 能力が人間の知性の特性となっている 中央的• なコントローラと周辺のドメインに特化したメモリ領域によっ て構成されていると考えられている LSTM• とDNCが作業記憶に相当 LSTM: Long Short Term Memory• DNC: Differential• Neural Computer
  • 20. The Present (4): Continual Learning • 人間を始めとする知的なエージェントは、異なる時間軸で異な るタスクを学習し、思い出していく事が必要 • つまり、以前のタスクでの学習を忘れることなく、新しいタスクを学 習できるということ • 以前のタスクに関する知識を守るメカニズムが見つかっている • ANNには “catastrophic forgetting” の問題が知られていた • EWC (Elastic Weight Consolidation) proposed by Kirkpatrick et al., 2017, is a solution • ネットワークの重みのうち、以前のタスクで重要な一部分を固定する
  • 21. The Future • Intuitive Understanding of the Physical World • Efficient Learning • Transfer Learning • Imagination and Planning • Virtual Brain Analytics
  • 22. The Future (1): Intuitive Understanding of the Physical World • 人間の場合、空間・数・物体感といった概念が乳児の段階にす でによく発達する一方で、ほとんどの AI は実現できていない • ある ANN は、個々の物体とその関係に分解することで、シー ンを解釈することができている • ディープなRLを用いて、子供が対話的な実験を通して常識を理 解する仮定を捉えることができた (Denil et al., 2016)
  • 23. The Future (2): Efficient Learning 人間• の認知は、事前知識を元に自在に用いることで数少ない事 例から新しい概念を学習できる点が特徴としてあげられる この• 認知機能に関する課題として Lake et al. が 2016 年に “characters challenge” を作った 最近• の AI アルゴが、確率的モデル・ディープな生成モデルの 両面で進歩があった
  • 24. The Future (3): Transfer Learning • 人間は経験の汎化と移転にも長けている • 車を運転できる人が、別の種類の車にも乗れるなど • “Progressive Network” が成果を上げている (Rusu et al., 2016) • あるゲームに関する学習を利用して、他のゲームの学習時間を短縮 • シミュレーション環境のロボットの学習を利用して、実世界のロボッ トの学習時間を短縮 • 移転学習の文脈で、関係性をもとに推論する能力も考えられる • 一般的に人間がどのように高次の移転学習をしているかはわかってい ない
  • 25. The Future (4): Imagination and Planning • 動物は将来の報酬をシミュレートして、柔軟に行動を選択する • 内部に環境モデルを構築し、シミュレーションを行っていると考えら れる • 例えばラットが選択点で止まっている時に、後に通行可能な軌跡を 通っている時に観測される海馬の活動と似たような活動が観測される • ディープな生成モデルがここでも活躍する • 現実空間のレイアウトをもとに連続したサンプルを生成できるモデル が提案された (Gemici et al., 2017) • シミュレーションの結果をエージェントの行動計画に用いる手法はま だ存在していない • 海馬でどのように内部モデルが存在しているかはまだ不明
  • 26. The Future (5): Virtual Brain Analytics • AIシステムの “ブラックボックス” を、神経科学の手法で解明 • 単独細胞の記録、イメージング等 • 次元削減によるニューラルネットワーク(DQN)の可視化 (Zahavy et al. 2016)
  • 27. From AI to NS 機械学習• の手法を用いた神経画像(fMRI/MEG)の解析 • 脳とTD学習の関連 CNN• と ventral visual stream における情報表現の関連 Backpropagation• と脳における学習の違い フィードフォワード・フィードバックの• 対称性が脳では観測されない • 脳は局所的な信号を用いて学習する一方、BPでは非局所的な誤差信号 を用いる
  • 28. 所感 • NS が AI の発展に重要な役割を果たしていることが伝わった • AI が思いの外幅広く脳機能をカバーしつつあることがわかっ た • 引いている論文が非常に多く、筆者のリサーチ力がすごい • 読むべき論文が芋づる式に見つかるので、一度読んだほうがいい • DeepMind 強い • 筆者を始め、引かれている論文も DeepMind 発が多かった