More Related Content Similar to Training object class detectors with click supervision (9) More from Takanori Ogata (15) Training object class detectors with click supervision5. Deep Leanring ✕ 一般物体検出は、大抵Bounding Boxを教師データとして与える
=> 大量のデータが必要なので、クラウドソーシングを活用
一般物体検出を学習させるときの課題
6. Deep Leanring ✕ 一般物体検出は、大抵Bounding Boxを教師データとして与える
=> 大量のデータが必要なので、クラウドソーシングを活用
でも、、、
WorkerがBounding Boxをannotationするの結構時間かかる(25.5s/box)
チェックに時間かかる
作業結果のクオリティー担保むずい
一般物体検出を学習させるときの課題
16. Amazon Mechanical Turk (AMT) で実験
PASCAL VOC 2007でデータを作成(14,612 clicks in total for the
5,011 trainval images)
Annotation time: 平均1.87s/click、3.8時間でアノテーションを完了
Data collection
18. Multiple Instance Learning (MIL)
[Dietterich et al., 1997]
positive bags(正解を1つ以上含む)
と、negative bags(正解を含まない)を
用いた機械学習手法の一つ
MILによる物体検出器作成
B. Babenko, M.-H. Yang, and S. Belongie. Visual Tracking with
Online Multiple Instance Learning. In CVPR, 2009
23. ■Box area score
物体の大きさとアノテーションの誤差は相関がある(Fig. 4)
=> 2つのアノテーションの距離から物体候補を推定する(Fig. 6)
μ: 物体エリアの対数を推定するfunction(後術)、a_p: 物体候補エリア
(a_p - μ)は2つのエリアの対数比を表す
■Use in re-localization
前述と同じような形でトータルスコアに組み合わせる
Two-click supervision
26. ■PASCAL VOC 2007
20 classes / 5,011 training images / 4,952 test images.
■Evaluation
- Correct Localization (CorLoc)
物体候補が正しい位置にあるか?(Bounding Boxの重なり度合い
(i.e. IoU ≧ 0.5) )を測る
*Training Imageに対して計測
- mAP
学習器が正しく動くか、Test Imageに対してmAPを計測
Experimental results
28. ■MS COCO dataset
80 classes / 82,783 training images / 40,504 val images
VOC 2007と同じ条件て計測
- Click supervision
COCOのデータセットに対してはクリックアノテーションを
シミュレーションで行った
Experimental results
30. (余談) vs SOTA Object detection algorithm
J. Redmon and A. Farhadi. Yolo9000: Better, faster, stronger