SmoothGrad: removing noise by adding noise

DLゼミ
2018.05.07
発表者 M2 平間友大
本発表の内容
・畳み込みニューラルネットワーク（CNN）の判断根拠の理解する手法を学ぶ
→学習されたネットワークの挙動を知る
読んできた論文 ”SmoothGrad: removing noise by adding noise”
Smilkov, D., Thorat, N., Kim, B., Viégas, F., & Wattenberg, M. (2017).
https://arxiv.org/abs/1706.03825

画像認識において高い精度を発揮しているCNNの弱点
→ 判断に至る過程、根拠を人間が理解できない
理解できないと困ること
・判断をもとに行動を起こさせるシステム、判断過程をユーザーが求める場合
病気の判断
避難経路
・判断根拠のブラックボックスを利用したハッキング
道路認識を誤認
NIPSでも防衛策が議論されている
CNNの判断根拠を理解する意義

CNNの学習済みモデルを説明できるようにする
・仕組みについて：モデルのどのような作用が働いて出力に至っているのか
・挙動について：どんな入力をしたらどんな出力となるか
つまり
自販機で言えば、どのボタンを押せばどんな飲み物が出てくるのかを説明で
きるようになること。内部の電気信号や機械の説明については置いておく。
学習済みモデルを説明する→人間が理解可能な表現＝可視化する必要がある
判断根拠の「理解」の定義

感度マップ sensitivity map
x：入力画像
Sc:判別関数
class(x)：クラス
バニラ法
入力画像のどこの領域がクラス決定に影響しているかを可視化する
・画素を変化させることで出力に大きな変化が出るものを重要な特徴と捉える
変化の度合いは微分することで求められる
→勾配を使うDeep Learningと相性が良い

仮説画素値の変化が過剰に反応し、ノイズとなる
元画像変化後
t：[0,1]
ε：N(0, 0.01^2)からランダムサンプリング

SmoothGrad: removing noise by adding noise[1]
[1]Smilkov, D., Thorat, N., Kim, B., Viégas, F., & Wattenberg, M. (2017).
https://arxiv.org/abs/1706.03825
提案手法
画像にガウシアンノイズを加えて類似した画像を作成
→サンプル画像ごとに結果の感度マップを生成、平均したもの
n：サンプル数
σ：標準偏差

ILSVRC-2013データセットで訓練されたInception v3モデル
tensorflowのチュートリアルにあるMNISTモデル
SmoothGradの特徴
勾配を直接可視化するのではなく、ガウシアンノイズを用いて
平滑化することで、感度マップのノイズを消す
ガウシアンノイズ：各ピクセルの輝度Xを中心に適当な標準偏差σで正規分布乱
数をふり、値を変化させるノイズのこと。
Xの変化量が±σに収まる確率は68.2%. ±2σに収まる確率は約95%.
利用モデル

感度マップの先行研究
・Guided BackProp (Springenberg et al., 2014) [2]
出力から入力に向かって重みを辿る方式。重みがマイナスの値は０にしてい
る（ReLUと同等の処理を行なっている）
→正の重みの特徴を辿るため、出力に影響する入力のみに辿り着ける
・Integrated Gradients手法 (Sundararajan et al., 2017)[3]
Guided BackPropの方式に加え、複数の勾配を利用したもの？（調査不足）
課題
・ノイズの除去
[3] Sundararajan, M., Taly, A., & Yan, Q. (2017). Axiomatic attribution for deep networks. arXiv preprint arXiv:1703.01365.
[2] Springenberg, Jost Tobias, et al. "Striving for simplicity: The all convolutional net." arXiv preprint arXiv:1412.6806 (2014).

手法の定量的な評価は難しい
→定性的評価と先行研究との比較に焦点を当てて考察する
・視覚的な一貫性
ハイライトが背景ではなく関心のあるオブジェクト上にのみ存在するか
・識別性テスト
２つのオブジェクトを分けることができるか
評価手法
・Vanilla gradient
・Guided BackProp (Springenberg et al., 2014)
・Integrated Gradients (Sundararajan et al., 2017)
定性的評価
先行研究

実験結果
サンプル数を固定し、ノイズレベル変化させた時の影響
Noise level : σ/各チャネルの(最大値ー最小値）
Sample size：50

実験結果
Noise level: 10%
Sample size ：n
ノイズレベルを固定し、サンプル数を変化させた時の影響

感度マップと元画像の乗算
実験結果
感度マップのみ
効果あり
弱い効果

２つのオブジェクトを分けて識別できるか
各クラスの感度マップを計算し、[0,1]にスケール
M1(x) - M2(x)を行い、[-1, 0, 1] → [blue, gray, red]のカラーマップへ
実験結果
M1
M2

実験結果従来手法にSmoothGradを加えた結果

学習済みモデルにも十分適用できるが、これから学習する場合にはノイズを
加えて学習させるとより良い結果が得られる
訓練にノイズを加えることで、感度マップにノイズ除去効果がある
実験結果

Sample size: 100
勾配を絶対値で計算すると、白黒画像になるためもと画像と変わらない
勾配は負になる場合もあるので、色空間を設けた
実験結果 MNISTの感度マップ

まとめ
・従来手法と比較し、表現の一貫性を得られた
・従来手法と組み合わせることで、より視覚的に見やすく、ノイ
ズを除去できた
・判断根拠となる注目画素がどこかを明らかにしたが、
なぜその点が重要なのかという疑問に答える手法ではない
・あくまで、学習済みモデルが判別するための注目画像に関して
可視化、人間にとって意味のある表現ができた
・CNNの理解は、システム化する上で重要となってきている

SmoothGrad: removing noise by adding noise

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

More from harmonylab

More from harmonylab (20)

SmoothGrad: removing noise by adding noise