SlideShare a Scribd company logo
1 of 33
Download to read offline
含意要因となるテキスト中の表現と
仮説の対を用いたテキスト含意認識
長岡技術科学大学 電気系 
宇高 邦弘,  山本 和英
研究背景
・テキスト中の一部の表現から含意関係を認識可能
⇒含意要因となる表現と仮説の対を集めること
で含意関係認識が可能
1
研究目的
・PASCAL1~PASCAL3で公開された評価セット
から対を抽出
・抽出した対を用いてテキスト含意認識
 ⇒自然言語処理タスクに存在する推論を対象とし
 たテキスト含意認識
2
含意要因表現-仮説対の抽出方法
・PASCAL1~PASCAL3で公開された評価セット
から抽出
  ⇒テキスト中にある含意要因となる表現と
   仮説を対にして人手で抽出
  
  ⇒2,304のテキストと仮説の対から994の
   含意要因表現-仮説対を抽出
3
含意要因表現-仮説対の抽出例 
テキスト:ドイツの航空会社であるルフトハンザ
     はミュンヘンに直行します
仮説:ルフトハンザはドイツの航空会社だ
4
含意要因表現-仮説対の抽出例
テキスト:ドイツの航空会社であるルフトハンザ
     はミュンヘンに直行します
仮説:ルフトハンザはドイツの航空会社だ
5
抽出した対の特徴
・「の」で結合された名詞
・包含
・述語含意
6
抽出した対を用いた含意認識手法
・抽出した対と入力されるテキスト-仮説対を照合
 ⇒構文解析により文節対に分解
 ⇒抽出した対から作成される文節対がテキスト-
  仮説対に全て含まれている場合は含意と判断
7
抽出した対を用いた含意認識の例
入力テキスト:イリノイ生まれのチャールズは27歳の俳優でした
          イリノイ生まれ-チャールズ
          チャールズ-俳優
          27歳-俳優
入力仮説:  チャールズはイリノイで生まれた
          チャールズ-生まれ
          イリノイ-生まれ
抽出した対:
含意要因表現:イリノイ生まれのチャールズ
         イリノイ生まれ-チャールズ
仮説:チャールズはイリノイで生まれた
         チャールズ-生まれ
          イリノイ-生まれ
8
抽出した対を用いた含意認識の流れ
9
抽出した対を用いた含意認識の流れ 
10
抽出した対を用いた含意認識の流れ 
11
抽出した対を用いた含意認識の流れ
12
抽出した対を用いた含意認識の流れ
13
認識実験
・抽出した994の含意要因表現-仮説対を使用
・対の抽出に使用した2,304の含意関係を持つテ
キスト-仮説対
14
抽出した対を用いた含意認識結果
入力した
テキスト-仮説対の数
2,304
含意要因表現-仮説対を抽出
したテキスト-仮説対の数
1,013
含意要因表現-仮説対を抽出し照合
したテキスト-仮説対の数
633
含意要因表現-仮説対を抽出できず
照合したテキスト-仮説対の数
0
含意要因表現-仮説対を抽出し
照合しないテキスト-仮説対の数
380
含意要因表現-仮説対を抽出できず
照合しなかったテキスト-仮説対の数
1,291
15
抽出した対を用いた含意認識結果 
入力した
テキスト-仮説対の数
2,304
含意要因-仮説対を抽出
したテキスト-仮説対の数
1,013
含意要因-仮説対を抽出し照合
したテキスト-仮説対の数
633
含意要因-仮説対を抽出できず
照合したテキスト-仮説対の数
0
含意要因-仮説対を抽出し照合
しなかったテキスト-仮説対の数
380
含意要因-仮説対を抽出できず
照合しないテキスト-仮説対の数
1,291
16
考察
・含意認識を誤った4割について
 ⇒含意要因表現-仮説対を抽出時に行った情報削除
による文節対の変化が原因
  
        
17
考察
・テキスト-仮説対に照合した含意要因表現-仮
説対の多くは1回しか照合しない
 ⇒抽出した対の名詞、複合名詞、固有名詞が原因
 ⇒他の含意認識評価セットへ適用し辛い
18
対からのパタン作成
・抽出した対について、名詞、複合名詞、固有名詞を対
象に汎化
・汎化語はwikipediaから人手で作成
19
パタンを用いた含意認識の流れ
20
パタンを用いた含意認識の流れ
21
パタンを用いた含意認識の流れ
22
パタンを用いた含意認識の流れ
23
パタンを用いた含意認識の流れ
24
パタンによる含意認識実験
・PASCAL1~PASCAL3の評価セットに含まれる
2,304のテキスト-仮説対を2つに分割
 ⇒682(PASCAL1)を入力
   1,622(PASCAL2,3)からパタン作成
・文節対での照合
25
パタンを用いた含意認識結果
⇒作成したパタンに照合するテキスト-仮説対は
 少数
入力したテキスト-仮説対の数 682
含意要因表現-仮説対を抽出可
能なテキスト-仮説対の数 
357
パタンに照合したテキスト-仮説
対の数
16
26
考察 
・パタンに照合したテキスト-仮説対が少ない
 ⇒多様な表現を吸収できない
 
 
 ⇒適用可能な汎化語を用いてパタンを拡張
27
考察 
・パタンに照合したテキスト-仮説対が少ない
 ⇒多様な表現を吸収できない
  
 
 ⇒述語の同義、含意関係を知識としてまとめる
28
本研究のまとめ
・海外の含意認識評価セットから含意要因となる表現と仮説
の対を抽出し、含意認識
 ⇒994の含意要因表現-仮説対を抽出
 ⇒含意要因表現-仮説対を抽出できたテキスト-仮説対の
  6割を正しく含意認識
・汎用性を高めるために抽出した対からパタンを作成し、含意
認識
 ⇒624のパタンを作成
 ⇒ほとんどがパタンに照合せず
 ⇒様々な表現の違いを吸収することで改善可能
29
ご清聴ありがとうございました
抽出した対の照合による含意認識 
入力した
テキスト-仮説対の数
2,304
含意要因-仮説対を抽出
したテキスト-仮説対の数
1,013
含意要因-仮説対を抽出し照合
したテキスト-仮説対の数
10
含意要因-仮説対を抽出できず
照合したテキスト-仮説対の数
0
含意要因-仮説対を抽出し照合
しなかったテキスト-仮説対の数
1,003
含意要因-仮説対を抽出できず
照合しないテキスト-仮説対の数
1,291
多くの対がそのままの
形ではT-H対に照合し
ない
⇒対抽出時の情報の削
除が原因
Wikipediaからの上位下位関係抽出
上位-下位
納豆-食品
納豆-塩辛納豆
発酵食品-納豆

More Related Content

More from 長岡技術科学大学 自然言語処理研究室

More from 長岡技術科学大学 自然言語処理研究室 (20)

小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
 
小学生の読解支援に向けた語釈文から語彙的換言を選択する手法
小学生の読解支援に向けた語釈文から語彙的換言を選択する手法小学生の読解支援に向けた語釈文から語彙的換言を選択する手法
小学生の読解支援に向けた語釈文から語彙的換言を選択する手法
 
Selecting Proper Lexical Paraphrase for Children
Selecting Proper Lexical Paraphrase for ChildrenSelecting Proper Lexical Paraphrase for Children
Selecting Proper Lexical Paraphrase for Children
 
Automatic Selection of Predicates for Common Sense Knowledge Expression
Automatic Selection of Predicates for Common Sense Knowledge ExpressionAutomatic Selection of Predicates for Common Sense Knowledge Expression
Automatic Selection of Predicates for Common Sense Knowledge Expression
 
用言等換言辞書を用いた換言結果の考察
用言等換言辞書を用いた換言結果の考察用言等換言辞書を用いた換言結果の考察
用言等換言辞書を用いた換言結果の考察
 
用言等換言辞書の構築
用言等換言辞書の構築用言等換言辞書の構築
用言等換言辞書の構築
 
質問意図によるQAサイト質問文の自動分類
質問意図によるQAサイト質問文の自動分類質問意図によるQAサイト質問文の自動分類
質問意図によるQAサイト質問文の自動分類
 
役所からの公的文書に対する「やさしい日本語」への変換システムの構築
役所からの公的文書に対する「やさしい日本語」への変換システムの構築役所からの公的文書に対する「やさしい日本語」への変換システムの構築
役所からの公的文書に対する「やさしい日本語」への変換システムの構築
 
対訳コーパスから生成したワードグラフによる部分的機械翻訳
対訳コーパスから生成したワードグラフによる部分的機械翻訳対訳コーパスから生成したワードグラフによる部分的機械翻訳
対訳コーパスから生成したワードグラフによる部分的機械翻訳
 
用言等換言辞書を人手で作りました
用言等換言辞書を人手で作りました用言等換言辞書を人手で作りました
用言等換言辞書を人手で作りました
 
文字列の出現頻度情報を用いた分かち書き単位の自動取得
文字列の出現頻度情報を用いた分かち書き単位の自動取得文字列の出現頻度情報を用いた分かち書き単位の自動取得
文字列の出現頻度情報を用いた分かち書き単位の自動取得
 
「やさしい日本語」変換システムの試作
「やさしい日本語」変換システムの試作「やさしい日本語」変換システムの試作
「やさしい日本語」変換システムの試作
 
常識表現となり得る用言の自動選定の検討
常識表現となり得る用言の自動選定の検討常識表現となり得る用言の自動選定の検討
常識表現となり得る用言の自動選定の検討
 
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
 
二格深層格の定量的分析
二格深層格の定量的分析二格深層格の定量的分析
二格深層格の定量的分析
 
大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得
 
文脈の多様性に基づく名詞換言の提案
文脈の多様性に基づく名詞換言の提案文脈の多様性に基づく名詞換言の提案
文脈の多様性に基づく名詞換言の提案
 
保険関連文書を対象とした文章校正支援のための変換誤り検出
保険関連文書を対象とした文章校正支援のための変換誤り検出保険関連文書を対象とした文章校正支援のための変換誤り検出
保険関連文書を対象とした文章校正支援のための変換誤り検出
 
Developing User-friendly and Customizable Text Analyzer
Developing User-friendly and Customizable Text AnalyzerDeveloping User-friendly and Customizable Text Analyzer
Developing User-friendly and Customizable Text Analyzer
 
普通名詞換言辞書の構築
普通名詞換言辞書の構築普通名詞換言辞書の構築
普通名詞換言辞書の構築
 

Recently uploaded

SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 

Recently uploaded (9)

SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 

含意要因となるテキスト中の表現と仮説の対を用いたテキスト含意認識