1. 2013/04/24 上智大学 山中高夫
フィッシャーベクトルによる画像認識
[0] 赤穂昭太郎,カーネル多変量解析,岩波書店,2009.
[1] F. Perronnin and C. Dance, “Fisher Kernels on Visual Vocabularies for Image
Categorization,” in IEEE Conference on Computer Vision and Pattern Recognition, 2007.
[2] F. Perronnin, S. Jorge, and T. Mensink, “Improving the Fisher Kernel for Large-Scale
Image Classification,” in European Conference on Computer Vision, 2010.
[3] F. Perronnin, Y. Liu, J. Sanchez, and H. Poirier, “Large-scale image retrieval with
compressed Fisher vectors,” in IEEE Conference on Computer Vision and Pattern
Recognition, 2010.
[4] J. Sanchez and F. Perronnin, “High-dimensional signature compression for large-scale
image classification,” in IEEE Conference on Computer Vision and Pattern Recognition,
2011.
[5] J. Krapac, J. Verbeek, and F. Jurie, “Modeling spatial layout with fisher vectors for
image categorization,” in International Conference on Computer Vision, 2011.
[6] V. Garg, S. Chandra, and C. V. Jawahar, “Sparse discriminative Fisher vectors in visual
classification,” in Indian Conference on Computer Vision, Graphics and Image
Processing, 2012.
[7] J. Sánchez, F. Perronnin, and T. de Campos, “Modeling the spatial layout of images
beyond spatial pyramids,” Pattern Recognition Letters, vol. 33, pp. 2216–2223, Dec.
2012.
11. Fisher Kernels on Visual Vocabularies for
Image Categorization
F. Perronnin and C. Dance, IEEE Conference on Computer
Vision and Pattern Recognition, 2007.
27. Improving the Fisher Kernel for
Large-Scale Image Classification
F. Perronnin, S. Jorge, and T. Mensink, European Conference
on Computer Vision, 2010.
40. まとめ
• 多変量解析に利用されるカーネル法を紹介し,カーネル関数の例として
フィッシャーカーネルを説明した.
• Bag of Visual Wordsの拡張として,フィッシャーカーネルに基づいた
フィッシャーベクトルを画像認識に適用した.ユニバーサルでコンパク
トな辞書で画像識別が可能である.
• L2正規化,パワー正規化,空間ピラミッドをフィッシャーベクトルに導
入することにより,複雑で高計算コストの手法と同等の画像識別精度が
実現可能であることを示した.高速な計算が可能なため,ImageNetなど
大規模データにも適用可能である.
• 下記の文献では,近年提案された画像識別手法を比較した結果,フィッ
シャーベクトルを利用した手法が高い精度を示すことが報告されている
K. Chatfield, V. Lempitsky, A. Vedaldi, and A. Zisserman, “The devil is in the details: an
evaluation of recent feature encoding methods,” British Machine Vision Conference, 2011.