【DL輪読会】DINOv2: Learning Robust Visual Features without Supervision
【DL輪読会】TIMs:Transformers with Competitive Ensembles of Independent Mechanisms
1. DEEP LEARNING JP
[DL Papers] TIMs:Transformers with Competitive Ensembles of
Independent Mechanisms
XIN ZHANG, Matsuo Lab
http://deeplearning.jp/
1
2. 書誌情報
● タイトル
○ Transformers with Competitive Ensembles of Independent Mechanisms
● 著者
○ Alex Lamb, Di He, Anirudh Goyal, Guolin Ke, Chien-Feng Liao, Mirco Ravanelli, Yoshua Bengio
● 研究機関:Mila, University of Montreal, Microsft Research Asia, Reaserach Center for Information
Technology Innovation, Academia Sinica.
● arXiv, Feb 2021
● 概要
○ Transformerのアーキテクチャを、独立メカニズムに基づいて改善する研究。
○ Attention機構で潜在表現の塊を複数のモジュールに分解して実現する。
2
9. Transformer Independent Mechanisms(TIMs)
- 同じpositionにあるMechanismsらの競争を誘発する機構:
a. Mechanismsの潜在表現 h を1つのスカラーに
b. softmaxでスコアを計算して、Mechanismsの優先順位を決める。
- Positions間で情報を共有
a. PositionAttention
b. スコアを重みとして、hを更新
M1
P1
M1
P2
M3
P2
9