Image net classification　with Deep Convolutional Neural Networks

IMAGENet Classification
輪＿ with Deep Convolutional Neural Networks
講： NIPS ‘12

2012 / 12 / 20
本位田研究室 M1
堀内新吾

発表論文
『IMAGENet Classification with Deep Convolutional
Neural Networks』
会議：NIPS 2012
著者：Alex Krizhevsky, Ilya Sutskever, Geoffrey E
Hinton
トロント大学のHinton先生と愉快な仲間たち

Object Recognition
応用例：
• カメラの顔認識
• 自動レジ
• ロボットの目
• etc…
近年の傾向：
• クラス数
• 訓練画像数
• 特徴量の複雑化
Cat?
Leopard?

ILSVRC2012
IM GENET Large Scale Visual Recognition Challenge
• 世界最大規模の画像認識コンテスト
カテゴリ数訓練画像検査画像テスト画像
1000 120万枚 50000枚 150000枚

※ ↑をダウンロードするだけで一週間かかる
Difficulty:
– データサイズの問題
– 訓練画像の数の多さの問題
– 識別の複雑さの問題

Typical OR Approach
訓練画像特徴抽出特徴量学習
クラスラベル

クラス
分類機

ﾃｽﾄ画像特徴量識別クラスラベル
特徴抽出

“どんな特徴量を使う
か”が最重要、だった

Proposal Approach
訓練画像
Deep クラスラベル

Conventional
Neural
クラスラベル
ﾃｽﾄ画像 Networks

• 内部で自動で特徴抽出
• 各層の間に荷重付き枝を持つようなNeural
Network

Result of ILSVRC 2012
Error Rate
0.4
34%
0.3 29%
27% 27% 26%

0.2
16%
0.1

0

わけが
わからない
よ

Agenda
• Overview
• ImageNet
• Architecture
– Deep Learning
– Convolutional NNs
– Acceleration
– Reducing Overfitting
• Learning
• Result and Evaluation

Overview
why? 実世界におけるクラス分類に耐える識別機を作
る
史上最大規模のNeural Network
how?
それを動かせるGPU

what? Reasonableな時間で圧倒的な性能を出した

Reasonableな時間で圧倒的な性能を出した
contrib.
GPU用のコードを公開した

IM GENET
WordNetの階層に従う画像データベース
url: http://www.image-net.org/
• カテゴリ22000
• 画像：1500万枚
１画像１カテゴリでbounding-boxや各種特徴量も配布

ex.)Chain-mailカテゴリの画像

Deep Learning
Output

識別機

教師あり学習

教師なし学習

Input

Deep Learning
Output

Traditional Approach Greedy Layer-wise Training[1]
• まとめて学習識別機 • 一層ずつ学習
• 多層autoencoder • 一層のautoencoder

× 時間  時間
× 効率  効率
× Vanishing Gradient × Overfitting
Problem

Input

Convolutional NNs[2]
• ＮＮsの問題
各ユニットが全て繋がっている
↓
• 提案１ • 入力の欠損
• 入力のズレ
• ノイズ
• 提案２の影響をＮＮｓ全体が学習してしまう

• 提案３

各ユニットへの入力を制限
• 前の層の一部のユニットの出力だけを受け取る
フィルタのようなもの
• 提案１ → 入力の誤差を全体に伝搬させない

• 入力範囲はオーバーラップするように選ぶ
• 提案２データの欠損に対応するため

• 提案３

重みを共有
• 入力範囲の同じ入力座標は同じ重みをもつ
• 提案１ • 同じフィルタを使って圧縮するイメージ
→ フィルタに対する入力の傾向を学習
→ 入力のズレ，ノイズに対応
• 提案２
問題: １つのフィルタについてしか学習できない

• 提案３

フィルタの数を増加
• 多数のフィルタを用意して出力を多次元化
異なる重みをもつ複数のフィルタを学習
• 提案１ • 様々な特徴を学習可能

• 提案２

• 提案３

Architecture of CNNs

5層のCNNｓ + 3層のNNｓ
• 入力：150,528次元
• ニューロン：約66万個，GPU2台に配置
253,440 – 186,624 – 64,896 – 64,896 – 43,264 –
4096 – 4096
• 出力：1000次元

Acceleration
ReLU Local Response Overlapping
GPU2台の学習 Pooling
非線形変換正規化

Acceleration

ニューロンのモデ
ル入力 x : 前の層の出力を各枝ごとに重み付けしたも
の
出力 f(x): 入力に非線形な変形を加えたもの
ex.) f(x) = tanh(x), (1 + e-x)-1
f(x)
問題点 : 莫大な回数行うとなると遅すぎる
-> もっと単純な変形で出力を決定したい

ＲｅＬＵ非線形変換
f(x) = max(0, x)
予備実験において6倍速くネットワークを収束

Acceleration

GPU間のデータのやり取りを制限
- 2,3層間，5,6層間，6,7層間だけ

Acceleration

• ReLU非線形変換の入力は全部負だとダメ
→ 近傍のフィルタの同じ座標の重みで正規
化
予備実験では約2％の性能向上

厚み：N
この範囲で正規化す

Acceleration

• 近傍の出力をまとめる
出力: 平均，最大値，etc…

• 一般的には範囲を分ける
図:Poolingのイメージ
→Overlapさせることでズレを
吸収

図:3×3, Overlap 1の例 0.3~0.4％の性能向上

Reducing Overfitting

 試験前に必死で勉強
 とりあえず丸暗記
 問題集は完璧！！

 応用問題しか出ない
 暗記だけだからヤバい
 勉強しない方が良かった

データの拡張
バリエーションを増やす
Dropout
ラベルを保存するような変換
1. トリミング+鏡像
訓練時：ランダムに切り取る
テスト時：中央＋4隅
2. 輝度の変更
主成分分析を利用
ガウス分布から固有値を抽出
固有値と乱数で輝度を変更
約1％の性能向上

Dropoutなし
データの拡張
バリエーションを増やす
Dropout[3]
ラベルを保存するような変換
• 出力の半分を0にする
1. トリミング+鏡像
CNNsなので重みは共有
訓練時：ランダムに切り取る
→ 他の部分で学習は可能
テスト時：中央＋4隅
Dropoutあり
2. 輝度の変更
• 他ニューロン任せをやめる
主成分分析を利用
ガウス分布から固有値を抽出
NNｓは影響度の高いニューロン
に固有値と乱数で輝度を変更
学習をまかせてしまうことがあ
約1％の性能向上
る

図：手書き数字画像から得た特徴

Learning
• 学習アルゴリズム：確率的勾配降下法
• 重みの初期化：
平均0のガウス分布からサンプリング
• 学習回数：90回
2台のGPUで5，6日かかった

Result

error rate

図：ILSVRCの結果圧倒的なエラー率の低さ

Sub-Result
• CNNsの構造の変化に対する性能評価

＊付きは2011年のデータも使って事前学習したものを利用

Qualitative Evaluation

1層目のレイヤーの出力．上: GPU1，下:
GPU2
• 1層目が獲得した特徴
– GPU1：傾き
– GPU2：色
• 脳の視覚野にも異なる性質に反応する部位が存
在
↑GPU間の通信を制限したことによるのではない
か？

Sammary

実世界にも応用可能な識別問題を解くために
CNNsとDeep Learningを用いた巨大なネットワーク
を
GPU2台の上に実装し
ImageNetのコンテストに応用したら

常識破りな結果が出ちゃった＾＾

Refference
[1]Deep Learning:
A fast learning algorithm for deep belief nets, GE Hinton, S Osindero, YW Teh -
Neural computation, 2006.
[2]CNNs:
Face recognition: A convolutional neural-network approach, S Lawrence, CL
Giles,et al. Neural Networks, IEEE Transactions on 1997
参考http://ceromondo.blogspot.jp/2012/09/convolutional-neural-network.html
[3]Dropout:
Improving neural networks by preventing co-adaptation of feature detectors, GE
Hinton, N Srivastava, A Krizhevsky, et al. 2012

Image net classification　with Deep Convolutional Neural Networks

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Viewers also liked

Viewers also liked (13)

Similar to Image net classification　with Deep Convolutional Neural Networks

Similar to Image net classification　with Deep Convolutional Neural Networks (20)

Recently uploaded

Recently uploaded (8)