More Related Content
More from 長岡技術科学大学 自然言語処理研究室
More from 長岡技術科学大学 自然言語処理研究室 (20)
共起要素のクラスタリングを用いた分布類似度計算
- 4. 既存研究
[相澤, 08]
- 特徴を強く表す素性のみを使用
[柴田ら, 09]
- 類似度計算に用いる式の検討
[Maayan Zhitomirsky-Geffet and Dagan, 09]
- ブートストラップ法を用いての素性選択
[朝倉ら, 10]
- 重みの相対性を用いた素性選択
③
- 7. クラスタリング
『ドイツ』 : 「の,ビール」 「の,首相」 「の,州」
『フランス』 : 「の,人々」 「の,大統領」 「の,地域圏」
↓
『ドイツ』 : 「クラスタa」 「クラスタx」 「クラスタy」
『フランス』 : 「クラスタb」 「クラスタx」 「クラスタy」
例
共起要素をクラスタリング結果に置き換える
⑥
- 8. クラスタリング : 手法
bayonによる共起要素のクラスタリング
共起要素の特徴量として単語と共起回数を使用する
『の:銀閣寺』: 京都(5),都市左京区(3),東山(4)
クラスタa → 「の:南禅寺」,「の:銀閣寺」
出力例
入力例