Submit Search
Upload
DeepTypeの解説
•
Download as PPTX, PDF
•
1 like
•
1,418 views
Hiroki Nakayama
Follow
arXivTimesで話したDeepTypeの解説
Read less
Read more
Engineering
Report
Share
Report
Share
1 of 25
Download now
Recommended
Neural Architecture for Named Entity Recognition
Neural Architecture for Named Entity Recognition
Hiroki Nakayama
ディープに作る固有表現認識
ディープに作る固有表現認識
Hiroki Nakayama
Improving Distributional Similarity with Lessons Learned from Word Embeddings
Improving Distributional Similarity with Lessons Learned from Word Embeddings
Hiroki Nakayama
Watson活用事例~Watsonハッカソンの例を通じて~
Watson活用事例~Watsonハッカソンの例を通じて~
Hiroki Nakayama
2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
Marius Sescu
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
Expeed Software
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
Pixeldarts
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
Recommended
Neural Architecture for Named Entity Recognition
Neural Architecture for Named Entity Recognition
Hiroki Nakayama
ディープに作る固有表現認識
ディープに作る固有表現認識
Hiroki Nakayama
Improving Distributional Similarity with Lessons Learned from Word Embeddings
Improving Distributional Similarity with Lessons Learned from Word Embeddings
Hiroki Nakayama
Watson活用事例~Watsonハッカソンの例を通じて~
Watson活用事例~Watsonハッカソンの例を通じて~
Hiroki Nakayama
2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
Marius Sescu
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
Expeed Software
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
Pixeldarts
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
marketingartwork
Skeleton Culture Code
Skeleton Culture Code
Skeleton Technologies
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Neil Kimberley
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
contently
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Albert Qian
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
SpeakerHub
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
Getting into the tech field. what next
Getting into the tech field. what next
Tessa Mero
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Lily Ray
How to have difficult conversations
How to have difficult conversations
Rajiv Jayarajah, MAppComm, ACC
Introduction to Data Science
Introduction to Data Science
Christy Abraham Joy
Time Management & Productivity - Best Practices
Time Management & Productivity - Best Practices
Vit Horky
The six step guide to practical project management
The six step guide to practical project management
MindGenius
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson36
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Applitools
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
GetSmarter
ChatGPT webinar slides
ChatGPT webinar slides
Alireza Esmikhani
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
Project for Public Spaces & National Center for Biking and Walking
More Related Content
Featured
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
marketingartwork
Skeleton Culture Code
Skeleton Culture Code
Skeleton Technologies
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Neil Kimberley
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
contently
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Albert Qian
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
SpeakerHub
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
Getting into the tech field. what next
Getting into the tech field. what next
Tessa Mero
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Lily Ray
How to have difficult conversations
How to have difficult conversations
Rajiv Jayarajah, MAppComm, ACC
Introduction to Data Science
Introduction to Data Science
Christy Abraham Joy
Time Management & Productivity - Best Practices
Time Management & Productivity - Best Practices
Vit Horky
The six step guide to practical project management
The six step guide to practical project management
MindGenius
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson36
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Applitools
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
GetSmarter
ChatGPT webinar slides
ChatGPT webinar slides
Alireza Esmikhani
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
Project for Public Spaces & National Center for Biking and Walking
Featured
(20)
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
Skeleton Culture Code
Skeleton Culture Code
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Getting into the tech field. what next
Getting into the tech field. what next
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
How to have difficult conversations
How to have difficult conversations
Introduction to Data Science
Introduction to Data Science
Time Management & Productivity - Best Practices
Time Management & Productivity - Best Practices
The six step guide to practical project management
The six step guide to practical project management
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
ChatGPT webinar slides
ChatGPT webinar slides
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
DeepTypeの解説
1.
DeepType: Multilingual Entity
Linking by Neural Type System Evolution @Hironsan 2018/02/21
2.
アブストラクト 多言語で使えるエンティティリンキング(EL)手法を提案 特徴は以下の2点 エンティティのタイプ情報を使用 WikipediaとWikidataを用いて教師データを自動生成 結果として、一部データセットにおいて、 ELの性能(F1)が10ポイント以上の向上
3.
用語の説明
4.
用語の説明 以下の用語について説明する エンティティリンキング(Entity Linking) メンション(Mention) エンティティ(Entity) タイプ(Type)
5.
エンティティリンキング(EL) メンションを知識ベースのタイトル(エンティティ)に 結びつけるタスク メンションはエンティティへの言及のこと 例はWikification and Beyond:
The Challenges of Entity and Concept Groundingより
6.
タイプ(Type) タイプとはエンティティについているラベルのことで、 上位概念やエンティティのトピックを表す DeepTypeではWikipediaの記事に付与されたカテゴリか ら100カテゴリほど選択して用いている 例: Jaguar_Carsという記事のカテゴリ a
7.
手法の説明
8.
手法の概要 大きくは以下の2つの処理に分けられる タイプ分類(Type Classifier) 曖昧性解消(Disambiguation) タイプ分類 曖昧性解消 メンション 周辺文脈
エンティティ
9.
タイプ分類 タイプ分類とはメンションをタイプに分類すること 分類には長期の依存性を捉えるためにBi-LSTMを使用 各単語ごとにタイプを出力
10.
タイプ分類が役に立つ理由 タイプがわかるとエンティティを絞りこめる Discovering Types for
Entity Disambiguationから画像引用
11.
タイプ分類における問題点 タイプ数(Wikipediaのカテゴリ数)が多すぎる 英語版Wikipediaのカテゴリ数は約1.7×106 タイプ数が多いことによるデメリット 学習に時間がかかる 概念が細かすぎる 解決策: 100種類程度のタイプを選んで使う
12.
タイプをどう選ぶか? 以下のスコアを最大化するようにタイプを選ぶ |A|・λはタイプ数が多くなりすぎないようにしている Soracle、Sgreedy、Learnabilityは後述 ここでAはタイプの集合
13.
SoracleとSgreedy Soracle: タイプの解決が100%上手くできたときの 曖昧性解消の性能 Sgreedy:リンクカウント情報だけ使ったときの 曖昧性解消の性能 (Soracle -
Sgreedy)が大きくなるようにする タイプが100%解決できたときにELの性能が 高くなるようなタイプを選ぶ
14.
Learnability 他のタイプとの区別が容易なタイプを選択したい そのために、AUCの平均値が大きくなるようにしたい 分類器には以下のFFNNを使う
15.
曖昧性解消(Disambiguation) 曖昧性解消では、タイプ分類の結果を用いてELする Pi,*(ti|m, D)は文書Dに出現したメンションmが タイプtiである確率 メンションは複数単語から構成されるが、 タイプの出力は単語ごとなので、 max-over-timeでまとめあげる
16.
実験概要
17.
検証内容 以下の性能を測定する タイプ選択 固有表現認識 エンティティリンキング
18.
実験結果
19.
タイプ選択 タイプ選択の手法を変更したときのELの性能 計算量が少ない手法でもそれなりのAccuracyを達成
20.
固有表現認識 文字と単語を入力として取り、タイプを出力する 分類器(Bi-LSTM-CNN)を事前学習 その後、最終層をCRFに変えて固有表現認識 あんまりよくないのはWikipediaのカテゴリがエンティ ティの上位概念を表すとは限らないからだと思われる
21.
エンティティリンキング 以下のデータセットを用いてELの性能を検証 Wikipedia、WKD30、CoNLL、TAC 2010 Wikipediaに対してはaccuracy約11%の改善 他のデータセットに対しては、1.5〜3.3%の改善
22.
エンティティリンキング 以下のデータセットを用いてELの性能を検証 Wikipedia、WKD30、CoNLL、TAC 2010 Wikipediaに対してはaccuracy約11%の改善 他のデータセットに対しては、1.5〜3.3%の改善 リンクカウントのみの性能が上がっているのは、リンク付の質が 上がったことと量が増えたことに起因する
23.
まとめ
24.
まとめ 多言語で使えるエンティティリンキング(EL)手法を提案 特徴は以下の2点 エンティティのタイプ情報を使用 WikipediaとWikidataを用いて教師データを自動生成 結果として、一部データセットにおいて、 ELの性能(F1)が10ポイント以上の向上
25.
参考文献 DeepType: Multilingual Entity
Linking by Neural Type System Evolution Discovering Types for Entity Disambiguation Wikification and Beyond: The Challenges of Entity and Concept Grounding 【統計学】ROC曲線とは何か、アニメーションで理解 する。
Download now