4. Quoraコンペとは
2017年 6月 13日 Quoraコンペ参加記録 4
正式名称:Quora Question Pairs
2つの質問が与えられてそれが同じかどうか判定する2値分類の精度度を競うコンペ
question1
question2
is_duplicate
What is the step by step guide to invest
in share market in india?
What is the step by step guide to
invest in share market?
0
What is a good book about design?
What are the best books about
designing for emotion?
0
Is "A Head Full of Dreams" going to be
Coldplay's last album?
What is the song "A head full of
dreams" by Coldplay about?
0
How do you get rid of 'super lice'?
How can girls get rid of lice and nits?
1
評価指標はlogloss
28. 上位の手法を見てみた
2017年 6月 15日 Quoraコンペ参加記録 28
• NLP特徴は大体DNNだけでやったとのこと、Feature Engineering嫌いらしい
• それ以外の特徴は以下
– WordNet similarity (based on a script i found on github) ← 試した
– Word mover distances, using glove840B word embeddings ← 試してない
– NER-based features. I got the tags with Stanford CoreNLP ← 知らなかった。。。
– POS-based features. Same thing ← 試した
h"ps://www.kaggle.com/c/quora-‐ques5on-‐pairs/discussion/34697