9. On the Global Geometry of Sphere-Constrained
Sparse Blind Deconvolution
Yuqian Zhang et al.
• 顕微鏡画像とかでは特にdeblurは重要.
• The activation signals are sparse (細胞とかエッジとかそうい
うの(?) )
• motion blurではなく,ボケですね.
• symmetric solution creates a local optima
• 議論から落ちた…わかりません….
10. Probabilistic Temporal Subspace Clustering,
Behnam Gholami, Vladimir Pavlovic Clustering Time Series Data
• Subspace Clustering: 同じsubspaceに属する→同じクラスタ
• Time Dependency: ガウス分布
• Number of Subspaces: stick-breaking process
• Dimensionality: Beta-Bernoulli Process
• Missing data: Marginalization
• 肝心な部分を聴き逃しました…,むぅ.集中力が落ちてきています.
• Mocap Datasetで実験
• Missing Dataに対しても良いパフォーマンス.
11. Provable Self-Representation Based Outlier
Detection in a Union of Subspaces,
Chong You, Daniel P. Robinson, René Vidal
• 同じくSubspace クラスタリング.
• Outlierが面倒くさい.
• outlierを一つのsubspaceに押し込める!←あれ??
• Computer self-representation
• inlierは顔,outliersは顔以外
• 多分,問題として簡単すぎるので,査読がちょっとゆるくない?
# 自分はoutlier detection + クラスタ数推定で,これより上手く動き
そうなのに落とされたので不満がある….
• random walkで,ぐるぐる廻れるならinlier
• outlierでもinlierに近ければグルグル回れそうなのだが,詳細不明.
12. Learning to Extract Semantic Structure From
Documents Using Multimodal Fully
Convolutional Neural Networks Xiao Yang et al.
• 文書画像をブロックや見出しなどの領域に分ける.
• Text Embedding Mapというものを作成し,最終層(FC)の前に
追加.
• 一方で,手前の方で分岐しておいて,元の画像を復元するよう
に学習(←predictの時は使わない)
• 実装自体は,論文の図を見れば一発でわかる.
13. FFTLasso: Large-Scale LASSO in the Fourier
Domain
Adel Bibi, Hani Itani, Bernard Ghanem
• L1正則化の計算
• 提案手法は計算時間が早い
• 計算量的には O(m^3)→O(mnlog m)
• m^2 > n log m なら早い.正方行列はこれを満たす.n^2>n log n?
• 計算量の理論値に対して,実験結果から得られる,実際の速度
の改善幅が小さいようにも見える.
• コード: https://github.com/adelbibi/FFTLasso
14. ポスターまで記述するのは力尽きました
• 希望があれば関西CVPRML勉強会で解説.
• 良く見て聴いてきたリスト(面白いと思ったもののみ掲載)
• Deeply Supervised Salient Object Detection with Short Connections, Qibin Hou, Ming-
Ming Cheng, Xiaowei Hu, Ali Borji, Zhuowen Tu, Philip Torr
• 抽象度の高い層のfeature mapを浅い層のfeature mapにくっつけて(short connections),各層でsaliency
mapを作成し,それらのmapをlinear sumすると良い結果を得られるらしい.
• 抽象度が高すぎると物体のディテールが失われる?,ということだと思う.
• それぞれの層の寄与度がよくわからないから,本当にそれが利いているのかポスターからも,質問しても,
よくわからなかった.
• Learning Cross-Modal Deep Representations for Robust Pedestrian Detection, Dan Xu,
Wanli Ouyang, Elisa Ricci, Xiaogang Wang, Nicu Sebe
• 可視光画像と温度画像のデータを相互に利用して,それぞれのセンサが苦手なところを,補うような学習
ができる→RGB画像のみでの精度があがる.
• Annotating Object Instances with a Polygon-RNN, Lluís Castrejón, Kaustav Kundu, Raquel
Urtasun, Sanja Fidler [Best Paper Honorable Mention Awards]
• 詳細な領域形状のアノテーションを楽にするために,物体を囲むPolygonの編集点をRNNで出力するような学習を行った
• 人間がacceptableなレベル(どうやって決めた??)まで精度が出た
15. 続き
• 希望があれば関西CVPRML勉強会で解説
• 良く見て聴いてきたリスト(面白いと思ったもののみ掲載)
• Online Graph Completion: Multivariate Signal Recovery in Computer Vision, Won Hwa Kim,
Mona Jalal, Seongjae Hwang, Sterling C. Johnson, Vikas Singh
• グラフ信号処理を利用しているように思える.
• 点群の欠損を上手く保管しているみたい.
• やはり,グラフ信号処理の勉強が足りない….
• A Message Passing Algorithm for the Minimum Cost Multicut Problem, Paul Swoboda,
Bjoern Andres
• 普通のgraph cutはグラフを2つにしか分けられない.multicut(3つ以上に分ける)はNP-hard
• 近似非(lower bound)などの詳細がポスターにはなかったが,linearで動くらしい.
• Depth from Defocus in the Wild, Huixuan Tang, Scott Cohen, Brian Price, Stephen Schiller,
Kiriakos N. Kutulakos
• 手法の詳細は不明だが,CNN使ってない!?しかし,かなり出来ていそうだった.スマホ画像に対して動作さ
せていた模様.一見すると,そこまでdefocusが目立つようには見えない画像.