SlideShare a Scribd company logo
1 of 32
Download to read offline
日本語の語彙平易化システム
および評価セットの構築
首都大学東京(小町研)D1
梶原 智之 kajiwara@jnlp.org
https://sites.google.com/site/moguranosenshi/
2015年4月29日
データ構造と情報検索と言語処理勉強会 #DSIRNLP 07
自己紹介
•  梶原 智之 @moguranosenshi
•  長岡技術科学大学(新潟県)http://www.jnlp.org/
– 言い換え、特に語彙的換言
– テキスト平易化、特に語彙平易化
•  首都大学東京(東京都)http://cl.sd.tmu.ac.jp/
– 言い換え
– テキスト平易化
– NLP若手の会プログラム委員
2
研究の背景
3
大量・多様なテキストデータ
アクセスは容易 理解は容易?
子供 大人 外国人 高齢者
研究の背景
4
大量・多様なテキストデータ
アクセスは容易 理解は容易?
子供 大人 外国人 高齢者
効率的な情報収集・知識獲得のため
言語能力の差を埋める技術が必要
文章読解支援のための語彙平易化
語彙平易化
5
文中の難解な語をより平易な同義語に置換
四国に赴く
四国に行く
対象 評価尺度 赴く 行く
大人 単語親密度DB 難:1 → 易:7 5.0 6.469
子ども 学習基本語彙 難:­ → 易: ­
外国人 日本語能力試験 難:1 → 易:4 1 4
外国人 日本語教育語彙表 難:6 → 易:1 5 1
幅広い読者の文章読解を支援する
文章読解支援のための語彙平易化
•  語彙平易化システム
– 梶原智之, 山本和英. 日本語の語彙平易化シス
テムの構築. 情報処理学会第77回全国大会講
演論文集(第2分冊), pp.167-168, 2015.
•  語彙平易化の評価のためのデータセット
– 梶原智之, 山本和英. 日本語の語彙平易化評価
セットの構築. 言語処理学会第21回年次大会
発表論文集, pp.501-504, 2015.
6
Simplification 研究の盛り上がり
Text Simplification
OR
Lexical Simplification
OR
Syntactic Simplification
Matthew Shardlow. A Survey of Automated Text
Simplification. International Journal of Advanced
Computer Science and Applications, Special Issue
on Natural Language Processing, pp.58‒70, 2014.
English Lexical Simplification
•  SemEval-2012: English Lexical Simplification Task [1]
•  9つのシステムが参加
•  文脈を考慮して高頻度語に置換
•  Simple English Wikipedia
•  語彙と文法に制限をかけた平易なWikipedia
•  Wikipediaとのアライメント → 対訳コーパス [2], [3]
•  語彙平易化規則を学習 [4]
•  統計翻訳の枠組みで平易化 [5], [6]
[1] Lucia Specia et al. (2012) Semeval-2012 Task 1: English Lexical Simplification
[2] Zhemin Zhu et al. (2010) A Monolingual Tree-based Translation Model for Sentence Simplification
[3] David Kauchak (2013) Improving Text Simplification Language Modeling Using Unsimplified Text Data
[4] Colby Horn et al. (2014) Learning Lexical Simplifier Using Wikipedia
[5] William Coster and David Kauchak (2011) Learning to Simplify Sentences Using Wikipedia
[6] Sander Wubben et al. (2012) Sentence Simplification by Monolingual Machine Translation
8
関連研究(英語)
http://homepages.inf.ed.ac.uk/kwoodsen/demos/simplify.html https://rewordify.com/
9
•  任意の英語のテキストをWeb上で平易化できる
•  Automatic Sentence Simplification Using Wikipedia
•  Rewordify.com
関連研究(日本語)
http://www3.nhk.or.jp/news/easy/
10
•  特定の日本語のテキストがWeb上で平易化されている
•  NHK: NEWS WEB EASY
•  任意の日本語のテキストを平易化することはできない
日本語の語彙平易化システムの構築
本研究の目的
読解支援を必要とする読者に
語彙平易化の技術を届ける
本研究の貢献
・任意の日本語の文を平易化
 するシステムを構築した
・日本語の平易化システムを
 初めてWebで公開した
http://www.jnlp.org/SNOW/S3
11
日本語の語彙平易化システムの構築
公開されている日本語の言語処
理ツールや言語資源を組み合わ
せ、標準的なシステムを構築
形態素解析:MeCab
平易語:学習基本語彙
語彙的換言知識:
•  基本的意味関係の事例ベース
•  内容語換言辞書(SNOW D2)
•  動詞含意関係DB
•  日本語WordNet同義語DB
難易度:単語親密度DB
12
入力文
未来は若者が担う
語彙的換言の生成
担う:伝承する,引継ぐ,支える,受け継ぐ
難解語の検出
担う
出力文
未来は若者が支える
難易度に基づく並び替え
1:支える, 2:受け継ぐ, 3:伝承する, 4:担う, 5:引継ぐ
[1] Lucia Specia et al. (2012)
[1] Semeval-2012 Task 1: English Lexical Simplification
語彙平易化の基本的な流れ [1]
1.  形態素解析(MeCab)
2.  平易語リスト(学習基本語彙)に含まれない
内容語(名詞、動詞、形容詞、副詞)の抽出
13
難解語の検出
未来 名詞 / は 助詞 / 若者 名詞 / が 助詞 / 担う動詞
未来 名詞 / は 助詞 / 若者 名詞 / が 助詞 / 担う動詞
入力文
未来は若者が担う
語彙的換言の生成
担う:伝承する,引継ぐ,支える,受け継ぐ
難解語の検出
担う
出力文
未来は若者が支える
難易度に基づく並び替え
1:支える, 2:受け継ぐ, 3:伝承する, 4:担う, 5:引継ぐ
14
語彙的換言の生成
0% 20% 40% 60% 80% 100%
PPDB: Japanese
用言等換言辞書
普通名詞換言辞書
WordNet同義語DB
動詞含意DB(Ntriv)
動詞含意DB(Triv)
略記対
異形同義語対
異表記対
常に換言可能
文脈によって換言可能
常に換言不可能
入力文
未来は若者が担う
語彙的換言の生成
担う:伝承する,引継ぐ,支える,受け継ぐ
難解語の検出
担う
出力文
未来は若者が支える
難易度に基づく並び替え
1:支える, 2:受け継ぐ, 3:伝承する, 4:担う, 5:引継ぐ
•  先行研究 [7] の調査に基づき、
比較的高精度な言い換えを換言知識から収集
•  内容語換言辞書(SNOW D2)
•  日本語WordNet同義語データベース
•  動詞含意関係データベース
•  基本的意味関係の事例ベース
[7] 梶原智之, 山本和英 (2014) 日本語の語彙的換言知識の質的評価
15
語彙的換言の生成
入力文
未来は若者が担う
語彙的換言の生成
担う:伝承する,引継ぐ,支える,受け継ぐ
難解語の検出
担う
出力文
未来は若者が支える
難易度に基づく並び替え
1:支える, 2:受け継ぐ, 3:伝承する, 4:担う, 5:引継ぐ
16
難易度に基づく並び替え
•  単語親密度データベースを用いて単語に難易度を付与
  担う:5.3 (親密度が高いほど平易)
  引継ぐ:5.0 支える:5.7 受け継ぐ:5.5
入力文
未来は若者が担う
語彙的換言の生成
担う:伝承する,引継ぐ,支える,受け継ぐ
難解語の検出
担う
出力文
未来は若者が支える
難易度に基づく並び替え
1:支える, 2:受け継ぐ, 3:伝承する, 4:担う, 5:引継ぐ
Precision Recall F-measure
84.4 % 71.4 % 77.3 %
システム入出力 http://www.jnlp.org/SNOW/S3
17
【百貨店】から離れがちな【顧客】を、どう引き戻すか。
【デパート】から離れがちな【お客さん】を、どう引き戻すか。
【よもや】と思う変化が【いとも】簡単に起こる。
【まさか】と思う変化が【とても】簡単に起こる。
自覚の【欠如】が【嘆かわしい】。
自覚の【不足】が【悲しい】。
その笑顔には、子供を【慈しむ】父親の【眼差し】があった。
その笑顔には、子供を【愛する】父親の【視線】があった。
【ただただ】【感嘆する】ばかりである。
【とにかく】【感動する】ばかりである。
Precisionを改善しようとして失敗した話
•  Precision:84.4 % ← 誤った16%の変換は理解を妨害
•  誤りの例
•  高騰する:上がる, 値上がりする, ・・・
•  石油の値段が【高騰する】→ 石油の値段が【上がる】
•  石油が【高騰する】→ 石油が【上がる】
           石油が【値上がりする】
•  解決策
•  「値段」は上がる
•  「石油」は上がらない
→ 述語と項の関係を評価すれば精度が上がる!
→ 述語項構造解析を用いた語義曖昧性の解消
19
入力文
未来は若者が担う
語彙的換言の生成
担う:伝承する,引継ぐ,支える,受け継ぐ
難解語の検出
担う
出力文
未来は若者が支える
語義曖昧性の解消
引継ぐ,支える,受け継ぐ
難易度に基づく並び替え
1:支える 2:受け継ぐ 3:引継ぐ
語義曖昧性の解消
1.  述語項構造解析(SynCha)で【項, 格, 述語】の組を抽出
2.  格フレーム辞書(京大格フレーム)で三つ組を評価
石油が高騰する → 述語:高騰する, ガ格:石油
(石油, ガ, 上がる)(石油, ガ, 値上がりする)
(石油, ガ, 上昇する) (石油, ガ, 高くなる)
システム入出力 http://www.jnlp.org/SNOW/S3
20
Input 【レタス】がさっぱり【 感 】を醸し出す
Original 【 野 菜 】がさっぱり【気持ち】を醸し出す
+ WSD 【 野 菜 】がさっぱり【 気 分 】を醸し出す
Input ∼と【 決 意 】を語る
Original ∼と【決まる】を語る
+ WSD ∼と【 決 心 】を語る
Input ASEANへの【加盟】はベトナムの発展に貢献し
Original ASEANへの【入る】はベトナムの発展に貢献し
+ WSD ASEANへの【参加】はベトナムの発展に貢献し
System Precision
Original 84.4 %
+ WSD 89.0 %
4.6 ポイント改善
システム入出力 http://www.jnlp.org/SNOW/S3
21
Input 【レタス】がさっぱり【 感 】を醸し出す
Original 【 野 菜 】がさっぱり【気持ち】を醸し出す
+ WSD 【 野 菜 】がさっぱり【 気 分 】を醸し出す
Input ∼と【 決 意 】を語る
Original ∼と【決まる】を語る
+ WSD ∼と【 決 心 】を語る
Input ASEANへの【加盟】はベトナムの発展に貢献し
Original ASEANへの【入る】はベトナムの発展に貢献し
+ WSD ASEANへの【参加】はベトナムの発展に貢献し
System Precision
Original 84.4 %
+ WSD 89.0 %
4.6 ポイント改善
System Precision Recall F-measure
Original 84 % 71 % 77 %
+ WSD 89 % 8 % 15 %
日本語の語彙平易化システムの構築
形態素解析:MeCab
平易語:学習基本語彙
語彙的換言知識:
•  基本的意味関係の事例ベース
•  内容語換言辞書(SNOW D2)
•  動詞含意関係DB
•  日本語WordNet同義語DB
難易度:単語親密度DB
22
http://www.jnlp.org/SNOW/S3
Precision Recall F-measure
84.4 % 71.4 % 77.3 %
入力文
未来は若者が担う
語彙的換言の生成
担う:伝承する,引継ぐ,支える,受け継ぐ
難解語の検出
担う
出力文
未来は若者が支える
難易度に基づく並び替え
1:支える, 2:受け継ぐ, 3:伝承する, 4:担う, 5:引継ぐ
文章読解支援のための語彙平易化
•  語彙平易化システム
– 梶原智之, 山本和英. 日本語の語彙平易化シス
テムの構築. 情報処理学会第77回全国大会講
演論文集(第2分冊), pp.167-168, 2015.
•  語彙平易化の評価のためのデータセット
– 梶原智之, 山本和英. 日本語の語彙平易化評価
セットの構築. 言語処理学会第21回年次大会
発表論文集, pp.501-504, 2015.
23
研究資源の公開の重要性
•  語彙平易化システムの公開 [8]
•  読解支援を必要とする読者に語彙平易化の技術を届ける
•  http://www.jnlp.org/SNOW/S3
•  語彙平易化の評価のためのデータセットの公開
•  従来の人手評価のコストと再現性の課題を解決し、
 適合率および再現率の自動評価の枠組みを提供する
•  複数の語彙平易化システムの性能を直接比較する
•  http://www.jnlp.org/SNOW/E4
[8] 梶原智之, 山本和英 (2015) 日本語の語彙平易化システムの構築
24
日本語の語彙平易化評価セット
•  語彙的換言データセットの構築:対象語の選定
1.  IPA辞書 JUMAN辞書の内容語(名詞、動詞、形容詞、副詞)
2.  平易な語を削除
 ※学習基本語彙(小学生のための理解語彙)に含まれる語を削除
3.  換言が存在しない語を削除
 ※内容語換言辞書(SNOW D2)に含まれない語を削除
4.  低頻度語を削除
 ※新聞記事15年分での出現頻度が10未満の語を削除
対象語:名詞・動詞 75語、形容詞・副詞 50語(無作為抽出)
25
1.語彙的換言
  データセットの構築
2.語彙平易化
  データセットへの変換
日本語の語彙平易化評価セット
26
•  語彙的換言データセットの構築:換言の付与
•  各対象語に10種類の文脈を新聞記事から無作為に付与
•  5人のアノテータが文脈中で対象語の言い換えを列挙
•  アノテータ:クラウドソーシングで募集(http://www.lancers.jp/)
•  平均 5.38 語の語彙的換言が付与された(一致率:17.8%)
•  語彙的換言データセットの構築:付与された換言の評価
•  5人のアノテータのうち3人以上が
「適切な言い換えである」と回答した表現のみ採用
•  アノテータ:新たにクラウドソーシングで募集
•  平均 4.50 語の語彙的換言が採用された(一致率:66.4%)
日本語の語彙平易化評価セット
•  語彙平易化データセットへの変換:難易度で並び替え
•  5人のアノテータが文脈中で対象語とその換言を
平易な順に並び替え(一致率:33.2%)
•  アノテータ:換言の評価の際に募った作業者
•  語彙平易化データセットへの変換:難易度ランクの統合
•  5人の難易度ランクの平均値
•  クラウドソーシング:のべ500人が作業
•  換言の付与:のべ250人
•  換言の評価と並び替え:のべ250人
27
•  語彙的換言と語彙平易化の評価のためのデータセット
 二つの位置がピッタリ合ったところを【検出する】か、
 差を【検出する】かという部分だけが異なる。
•  【検出する】発見する 1;検知する 4;見つける 1;
•  平易 ← (見つける) (発見する・【検出する】) (検知する) → 難解
28
日本語の語彙平易化評価セット
データセット 総文数 名詞 動詞 形容詞 副詞
Speciaら 2,010 580 (28.9%) 520 (25.9%) 560 (27.9%) 350 (17.4%)
De Belderら 430 100 (23.3%) 60 (14.0%) 160 (37.2%) 110 (25.6%)
梶原ら
(SNOW E4)
2,330 630 (27.0%) 720 (30.9%) 500 (21.5%) 480 (20.6%)
データセットの特性
29
データセットの文脈依存性
①:対象語が同じ文脈の組 10,485
②:①のうち換言リストが等しい組 1,593
③:②のうち難易度ランクが違う組 948
④:③のうち最も平易な語が違う組 463
15.2%
59.5%
48.8%
対象語と文脈 換言リスト(上段)と難易度ランク(下段)
グルメというのが、食のバブル
であるとするなら、それは【
とっくに】終わった文化である
すでに;既に;とうに;随分前に;前に;もう;
{とっくに}{すでに}{もう}{既に}{とうに}{前に}{随分前に}
どうやら職場での飲酒は【とっ
くに】ばれていたらしい
とうの昔に;すでに;既に;とうに;随分前に;もう;
{とっくに}{すでに}{既に もう}{とうの昔に}{とうに}{随分前に}
【とっくに】気付いているかも
しれないが、写真中央にいるの
はF1でもおなじみのナイジェ
ル・マンセルだ
とうの昔に;すでに;既に;とうに;随分前に;もう;
{すでに}{もう}{とっくに}{既に}{とうに}{とうの昔に 随分前に}
言い換え:
文脈にとても
強く依存
平易化:
文脈に強く依存
データセットの特性
30
データセットの文脈依存性
①:対象語が同じ文脈の組 10,485
②:①のうち換言リストが等しい組 1,593
③:②のうち難易度ランクが違う組 948
④:③のうち最も平易な語が違う組 463
データセットの特性
換言リストの長さの平均 5.50
難易度ランクの平均 4.94
対象語よりも平易な語が存在する割合 69.4%
対象語と同じ難易度の語が存在する割合 18.0%
対象語よりも難解な語が存在する割合 83.5%
日本語の語彙平易化評価セットの構築
             http://www.jnlp.org/SNOW/E4
1.  語彙的換言データセットの構築
1.  対象語の選定
2.  クラウドソーシングを用いた語彙的換言の列挙
3.  複数の作業者による作業結果の統合
(クラウドソーシングを用いた語彙的換言の評価)
2.  語彙平易化データセットへの変換
1.  クラウドソーシングを用いた平易化候補の難易度による並び替え
2.  複数の作業者による作業結果の統合
•  語彙的換言と語彙平易化の評価のためのデータセット
 二つの位置がピッタリ合ったところを【検出する】か、
 差を【検出する】かという部分だけが異なる。
•  【検出する】発見する 1;検知する 4;見つける 1;
•  平易 ← (見つける) (発見する・【検出する】) (検知する) → 難解
31
宣伝
NLP東京Dの会
•  東京で自然言語処理を研究している
博士課程の学生が交流する会
•  第1回:2015/4/26(日) @首都大
•  D1 6人 + D2 2人
•  男女比 = 1:1
•  第2回:2015/5/23 or 24 @東工大
https://sites.google.com/site/nlptokyod/

More Related Content

What's hot

Rで計量時系列分析~CRANパッケージ総ざらい~
Rで計量時系列分析~CRANパッケージ総ざらい~ Rで計量時系列分析~CRANパッケージ総ざらい~
Rで計量時系列分析~CRANパッケージ総ざらい~ Takashi J OZAKI
 
DNNの曖昧性に関する研究動向
DNNの曖昧性に関する研究動向DNNの曖昧性に関する研究動向
DNNの曖昧性に関する研究動向Naoki Matsunaga
 
[DL Hacks]Variational Approaches For Auto-Encoding Generative Adversarial Ne...
[DL Hacks]Variational Approaches For Auto-Encoding  Generative Adversarial Ne...[DL Hacks]Variational Approaches For Auto-Encoding  Generative Adversarial Ne...
[DL Hacks]Variational Approaches For Auto-Encoding Generative Adversarial Ne...Deep Learning JP
 
Transformerを雰囲気で理解する
Transformerを雰囲気で理解するTransformerを雰囲気で理解する
Transformerを雰囲気で理解するAtsukiYamaguchi1
 
Neural word embedding as implicit matrix factorization の論文紹介
Neural word embedding as implicit matrix factorization の論文紹介Neural word embedding as implicit matrix factorization の論文紹介
Neural word embedding as implicit matrix factorization の論文紹介Masanao Ochi
 
[DL輪読会]When Does Label Smoothing Help?
[DL輪読会]When Does Label Smoothing Help?[DL輪読会]When Does Label Smoothing Help?
[DL輪読会]When Does Label Smoothing Help?Deep Learning JP
 
文法圧縮入門:超高速テキスト処理のためのデータ圧縮(NLP2014チュートリアル)
文法圧縮入門:超高速テキスト処理のためのデータ圧縮(NLP2014チュートリアル)文法圧縮入門:超高速テキスト処理のためのデータ圧縮(NLP2014チュートリアル)
文法圧縮入門:超高速テキスト処理のためのデータ圧縮(NLP2014チュートリアル)Shirou Maruyama
 
2014 3 13(テンソル分解の基礎)
2014 3 13(テンソル分解の基礎)2014 3 13(テンソル分解の基礎)
2014 3 13(テンソル分解の基礎)Tatsuya Yokota
 
教師なし画像特徴表現学習の動向 {Un, Self} supervised representation learning (CVPR 2018 完全読破...
教師なし画像特徴表現学習の動向 {Un, Self} supervised representation learning (CVPR 2018 完全読破...教師なし画像特徴表現学習の動向 {Un, Self} supervised representation learning (CVPR 2018 完全読破...
教師なし画像特徴表現学習の動向 {Un, Self} supervised representation learning (CVPR 2018 完全読破...cvpaper. challenge
 
因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説Shiga University, RIKEN
 
様々な全域木問題
様々な全域木問題様々な全域木問題
様々な全域木問題tmaehara
 
ウィナーフィルタと適応フィルタ
ウィナーフィルタと適応フィルタウィナーフィルタと適応フィルタ
ウィナーフィルタと適応フィルタToshihisa Tanaka
 
潜在ディリクレ配分法
潜在ディリクレ配分法潜在ディリクレ配分法
潜在ディリクレ配分法y-uti
 
音源分離における音響モデリング(Acoustic modeling in audio source separation)
音源分離における音響モデリング(Acoustic modeling in audio source separation)音源分離における音響モデリング(Acoustic modeling in audio source separation)
音源分離における音響モデリング(Acoustic modeling in audio source separation)Daichi Kitamura
 
Union find(素集合データ構造)
Union find(素集合データ構造)Union find(素集合データ構造)
Union find(素集合データ構造)AtCoder Inc.
 
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
深層学習の不確実性 - Uncertainty in Deep Neural Networks -深層学習の不確実性 - Uncertainty in Deep Neural Networks -
深層学習の不確実性 - Uncertainty in Deep Neural Networks -tmtm otm
 
強化学習と逆強化学習を組み合わせた模倣学習
強化学習と逆強化学習を組み合わせた模倣学習強化学習と逆強化学習を組み合わせた模倣学習
強化学習と逆強化学習を組み合わせた模倣学習Eiji Uchibe
 
言語と画像の表現学習
言語と画像の表現学習言語と画像の表現学習
言語と画像の表現学習Yuki Noguchi
 
新分野に飛び入って半年で業績を作るには
新分野に飛び入って半年で業績を作るには新分野に飛び入って半年で業績を作るには
新分野に飛び入って半年で業績を作るにはAsai Masataro
 
文章読解支援のための語彙平易化
文章読解支援のための語彙平易化文章読解支援のための語彙平易化
文章読解支援のための語彙平易化Tomoyuki Kajiwara
 

What's hot (20)

Rで計量時系列分析~CRANパッケージ総ざらい~
Rで計量時系列分析~CRANパッケージ総ざらい~ Rで計量時系列分析~CRANパッケージ総ざらい~
Rで計量時系列分析~CRANパッケージ総ざらい~
 
DNNの曖昧性に関する研究動向
DNNの曖昧性に関する研究動向DNNの曖昧性に関する研究動向
DNNの曖昧性に関する研究動向
 
[DL Hacks]Variational Approaches For Auto-Encoding Generative Adversarial Ne...
[DL Hacks]Variational Approaches For Auto-Encoding  Generative Adversarial Ne...[DL Hacks]Variational Approaches For Auto-Encoding  Generative Adversarial Ne...
[DL Hacks]Variational Approaches For Auto-Encoding Generative Adversarial Ne...
 
Transformerを雰囲気で理解する
Transformerを雰囲気で理解するTransformerを雰囲気で理解する
Transformerを雰囲気で理解する
 
Neural word embedding as implicit matrix factorization の論文紹介
Neural word embedding as implicit matrix factorization の論文紹介Neural word embedding as implicit matrix factorization の論文紹介
Neural word embedding as implicit matrix factorization の論文紹介
 
[DL輪読会]When Does Label Smoothing Help?
[DL輪読会]When Does Label Smoothing Help?[DL輪読会]When Does Label Smoothing Help?
[DL輪読会]When Does Label Smoothing Help?
 
文法圧縮入門:超高速テキスト処理のためのデータ圧縮(NLP2014チュートリアル)
文法圧縮入門:超高速テキスト処理のためのデータ圧縮(NLP2014チュートリアル)文法圧縮入門:超高速テキスト処理のためのデータ圧縮(NLP2014チュートリアル)
文法圧縮入門:超高速テキスト処理のためのデータ圧縮(NLP2014チュートリアル)
 
2014 3 13(テンソル分解の基礎)
2014 3 13(テンソル分解の基礎)2014 3 13(テンソル分解の基礎)
2014 3 13(テンソル分解の基礎)
 
教師なし画像特徴表現学習の動向 {Un, Self} supervised representation learning (CVPR 2018 完全読破...
教師なし画像特徴表現学習の動向 {Un, Self} supervised representation learning (CVPR 2018 完全読破...教師なし画像特徴表現学習の動向 {Un, Self} supervised representation learning (CVPR 2018 完全読破...
教師なし画像特徴表現学習の動向 {Un, Self} supervised representation learning (CVPR 2018 完全読破...
 
因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説
 
様々な全域木問題
様々な全域木問題様々な全域木問題
様々な全域木問題
 
ウィナーフィルタと適応フィルタ
ウィナーフィルタと適応フィルタウィナーフィルタと適応フィルタ
ウィナーフィルタと適応フィルタ
 
潜在ディリクレ配分法
潜在ディリクレ配分法潜在ディリクレ配分法
潜在ディリクレ配分法
 
音源分離における音響モデリング(Acoustic modeling in audio source separation)
音源分離における音響モデリング(Acoustic modeling in audio source separation)音源分離における音響モデリング(Acoustic modeling in audio source separation)
音源分離における音響モデリング(Acoustic modeling in audio source separation)
 
Union find(素集合データ構造)
Union find(素集合データ構造)Union find(素集合データ構造)
Union find(素集合データ構造)
 
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
深層学習の不確実性 - Uncertainty in Deep Neural Networks -深層学習の不確実性 - Uncertainty in Deep Neural Networks -
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
 
強化学習と逆強化学習を組み合わせた模倣学習
強化学習と逆強化学習を組み合わせた模倣学習強化学習と逆強化学習を組み合わせた模倣学習
強化学習と逆強化学習を組み合わせた模倣学習
 
言語と画像の表現学習
言語と画像の表現学習言語と画像の表現学習
言語と画像の表現学習
 
新分野に飛び入って半年で業績を作るには
新分野に飛び入って半年で業績を作るには新分野に飛び入って半年で業績を作るには
新分野に飛び入って半年で業績を作るには
 
文章読解支援のための語彙平易化
文章読解支援のための語彙平易化文章読解支援のための語彙平易化
文章読解支援のための語彙平易化
 

Viewers also liked

文献紹介:SemEval-2012 Task 1: English Lexical Simplification
文献紹介:SemEval-2012 Task 1: English Lexical Simplification文献紹介:SemEval-2012 Task 1: English Lexical Simplification
文献紹介:SemEval-2012 Task 1: English Lexical SimplificationTomoyuki Kajiwara
 
20150702文章読解支援のための日本語の語彙平易化システム
20150702文章読解支援のための日本語の語彙平易化システム20150702文章読解支援のための日本語の語彙平易化システム
20150702文章読解支援のための日本語の語彙平易化システムTomoyuki Kajiwara
 
Evaluation Dataset and System for Japanese Lexical Simplification
Evaluation Dataset and System for Japanese Lexical SimplificationEvaluation Dataset and System for Japanese Lexical Simplification
Evaluation Dataset and System for Japanese Lexical SimplificationTomoyuki Kajiwara
 
単語分散表現のアライメントに基づく文間類似度を用いたテキスト平易化のための単言語パラレルコーパスの構築
単語分散表現のアライメントに基づく文間類似度を用いたテキスト平易化のための単言語パラレルコーパスの構築単語分散表現のアライメントに基づく文間類似度を用いたテキスト平易化のための単言語パラレルコーパスの構築
単語分散表現のアライメントに基づく文間類似度を用いたテキスト平易化のための単言語パラレルコーパスの構築Tomoyuki Kajiwara
 
勾配降下法の 最適化アルゴリズム
勾配降下法の最適化アルゴリズム勾配降下法の最適化アルゴリズム
勾配降下法の 最適化アルゴリズムnishio
 
JWT! JWT! Let it all out!
JWT! JWT! Let it all out!JWT! JWT! Let it all out!
JWT! JWT! Let it all out!John Anderson
 
文章読解支援のための語彙平易化@第1回NLP東京Dの会
文章読解支援のための語彙平易化@第1回NLP東京Dの会文章読解支援のための語彙平易化@第1回NLP東京Dの会
文章読解支援のための語彙平易化@第1回NLP東京Dの会Tomoyuki Kajiwara
 
Noun Paraphrasing Based on a Variety of Contexts
Noun Paraphrasing Based on a Variety of ContextsNoun Paraphrasing Based on a Variety of Contexts
Noun Paraphrasing Based on a Variety of ContextsTomoyuki Kajiwara
 
日本語の語彙平易化評価セットの構築
日本語の語彙平易化評価セットの構築日本語の語彙平易化評価セットの構築
日本語の語彙平易化評価セットの構築Tomoyuki Kajiwara
 
日本語の語彙平易化システムの構築
日本語の語彙平易化システムの構築日本語の語彙平易化システムの構築
日本語の語彙平易化システムの構築Tomoyuki Kajiwara
 
小学生の読解支援に向けた語釈文による換言
小学生の読解支援に向けた語釈文による換言小学生の読解支援に向けた語釈文による換言
小学生の読解支援に向けた語釈文による換言Tomoyuki Kajiwara
 
日本語の語彙的換言知識の質的評価
日本語の語彙的換言知識の質的評価日本語の語彙的換言知識の質的評価
日本語の語彙的換言知識の質的評価Tomoyuki Kajiwara
 
文献紹介:言い換え技術に関する研究動向
文献紹介:言い換え技術に関する研究動向文献紹介:言い換え技術に関する研究動向
文献紹介:言い換え技術に関する研究動向Tomoyuki Kajiwara
 
文脈の多様性に基づく名詞換言の評価
文脈の多様性に基づく名詞換言の評価文脈の多様性に基づく名詞換言の評価
文脈の多様性に基づく名詞換言の評価Tomoyuki Kajiwara
 
文献紹介:新聞記事中の難解語を平易な表現へ変換する手法の提案
文献紹介:新聞記事中の難解語を平易な表現へ変換する手法の提案文献紹介:新聞記事中の難解語を平易な表現へ変換する手法の提案
文献紹介:新聞記事中の難解語を平易な表現へ変換する手法の提案Tomoyuki Kajiwara
 
文献紹介:Simple English Wikipedia: A New Text Simplification Task
文献紹介:Simple English Wikipedia: A New Text Simplification Task文献紹介:Simple English Wikipedia: A New Text Simplification Task
文献紹介:Simple English Wikipedia: A New Text Simplification TaskTomoyuki Kajiwara
 

Viewers also liked (20)

形態素解析器 売ってみた
形態素解析器 売ってみた形態素解析器 売ってみた
形態素解析器 売ってみた
 
Dsirnlp#7
Dsirnlp#7Dsirnlp#7
Dsirnlp#7
 
joint_seminar
joint_seminarjoint_seminar
joint_seminar
 
文献紹介:SemEval-2012 Task 1: English Lexical Simplification
文献紹介:SemEval-2012 Task 1: English Lexical Simplification文献紹介:SemEval-2012 Task 1: English Lexical Simplification
文献紹介:SemEval-2012 Task 1: English Lexical Simplification
 
20150702文章読解支援のための日本語の語彙平易化システム
20150702文章読解支援のための日本語の語彙平易化システム20150702文章読解支援のための日本語の語彙平易化システム
20150702文章読解支援のための日本語の語彙平易化システム
 
Evaluation Dataset and System for Japanese Lexical Simplification
Evaluation Dataset and System for Japanese Lexical SimplificationEvaluation Dataset and System for Japanese Lexical Simplification
Evaluation Dataset and System for Japanese Lexical Simplification
 
単語分散表現のアライメントに基づく文間類似度を用いたテキスト平易化のための単言語パラレルコーパスの構築
単語分散表現のアライメントに基づく文間類似度を用いたテキスト平易化のための単言語パラレルコーパスの構築単語分散表現のアライメントに基づく文間類似度を用いたテキスト平易化のための単言語パラレルコーパスの構築
単語分散表現のアライメントに基づく文間類似度を用いたテキスト平易化のための単言語パラレルコーパスの構築
 
tmu_science_cafe02
tmu_science_cafe02tmu_science_cafe02
tmu_science_cafe02
 
勾配降下法の 最適化アルゴリズム
勾配降下法の最適化アルゴリズム勾配降下法の最適化アルゴリズム
勾配降下法の 最適化アルゴリズム
 
JWT! JWT! Let it all out!
JWT! JWT! Let it all out!JWT! JWT! Let it all out!
JWT! JWT! Let it all out!
 
文章読解支援のための語彙平易化@第1回NLP東京Dの会
文章読解支援のための語彙平易化@第1回NLP東京Dの会文章読解支援のための語彙平易化@第1回NLP東京Dの会
文章読解支援のための語彙平易化@第1回NLP東京Dの会
 
Noun Paraphrasing Based on a Variety of Contexts
Noun Paraphrasing Based on a Variety of ContextsNoun Paraphrasing Based on a Variety of Contexts
Noun Paraphrasing Based on a Variety of Contexts
 
日本語の語彙平易化評価セットの構築
日本語の語彙平易化評価セットの構築日本語の語彙平易化評価セットの構築
日本語の語彙平易化評価セットの構築
 
日本語の語彙平易化システムの構築
日本語の語彙平易化システムの構築日本語の語彙平易化システムの構築
日本語の語彙平易化システムの構築
 
小学生の読解支援に向けた語釈文による換言
小学生の読解支援に向けた語釈文による換言小学生の読解支援に向けた語釈文による換言
小学生の読解支援に向けた語釈文による換言
 
日本語の語彙的換言知識の質的評価
日本語の語彙的換言知識の質的評価日本語の語彙的換言知識の質的評価
日本語の語彙的換言知識の質的評価
 
文献紹介:言い換え技術に関する研究動向
文献紹介:言い換え技術に関する研究動向文献紹介:言い換え技術に関する研究動向
文献紹介:言い換え技術に関する研究動向
 
文脈の多様性に基づく名詞換言の評価
文脈の多様性に基づく名詞換言の評価文脈の多様性に基づく名詞換言の評価
文脈の多様性に基づく名詞換言の評価
 
文献紹介:新聞記事中の難解語を平易な表現へ変換する手法の提案
文献紹介:新聞記事中の難解語を平易な表現へ変換する手法の提案文献紹介:新聞記事中の難解語を平易な表現へ変換する手法の提案
文献紹介:新聞記事中の難解語を平易な表現へ変換する手法の提案
 
文献紹介:Simple English Wikipedia: A New Text Simplification Task
文献紹介:Simple English Wikipedia: A New Text Simplification Task文献紹介:Simple English Wikipedia: A New Text Simplification Task
文献紹介:Simple English Wikipedia: A New Text Simplification Task
 

Similar to 日本語の語彙平易化システムおよび評価セットの構築

言語資源と付き合う
言語資源と付き合う言語資源と付き合う
言語資源と付き合うYuya Unno
 
言語と知識の深層学習@認知科学会サマースクール
言語と知識の深層学習@認知科学会サマースクール言語と知識の深層学習@認知科学会サマースクール
言語と知識の深層学習@認知科学会サマースクールYuya Unno
 
[最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
[最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」 [最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
[最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」 Yuki Arase
 
iYES オンラインプログラム
iYES オンラインプログラムiYES オンラインプログラム
iYES オンラインプログラムiYES Corporation
 
20190324 第6章 テキストデータのための素性
20190324 第6章 テキストデータのための素性20190324 第6章 テキストデータのための素性
20190324 第6章 テキストデータのための素性Kazuki Motohashi
 
さくさくテキストマイニング入門セッション
さくさくテキストマイニング入門セッションさくさくテキストマイニング入門セッション
さくさくテキストマイニング入門セッションantibayesian 俺がS式だ
 
Interspeech2022 参加報告
Interspeech2022 参加報告Interspeech2022 参加報告
Interspeech2022 参加報告Yuki Saito
 
2014LETシンポジウム WritingMaetriXについて
2014LETシンポジウム WritingMaetriXについて2014LETシンポジウム WritingMaetriXについて
2014LETシンポジウム WritingMaetriXについてWritingMaetriX
 
[旧版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
[旧版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」 [旧版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
[旧版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」 Yuki Arase
 
20190407 第7章 事例研究:自然言語処理における素性
20190407 第7章 事例研究:自然言語処理における素性20190407 第7章 事例研究:自然言語処理における素性
20190407 第7章 事例研究:自然言語処理における素性Kazuki Motohashi
 
データマイニングと外国語教育の接点としての自動採点研究
データマイニングと外国語教育の接点としての自動採点研究データマイニングと外国語教育の接点としての自動採点研究
データマイニングと外国語教育の接点としての自動採点研究Yutaka Ishii
 
ちょっと明日のテストの話をしよう
ちょっと明日のテストの話をしようちょっと明日のテストの話をしよう
ちょっと明日のテストの話をしようYasuharu Nishi
 
Interop2017
Interop2017Interop2017
Interop2017tak9029
 
ゼロから始める自然言語処理 【FIT2016チュートリアル】
ゼロから始める自然言語処理 【FIT2016チュートリアル】ゼロから始める自然言語処理 【FIT2016チュートリアル】
ゼロから始める自然言語処理 【FIT2016チュートリアル】Yuki Arase
 
英語学習者のための発話自動採点システムの開発.
英語学習者のための発話自動採点システムの開発.英語学習者のための発話自動採点システムの開発.
英語学習者のための発話自動採点システムの開発.Yutaka Ishii
 

Similar to 日本語の語彙平易化システムおよび評価セットの構築 (20)

言語資源と付き合う
言語資源と付き合う言語資源と付き合う
言語資源と付き合う
 
言語と知識の深層学習@認知科学会サマースクール
言語と知識の深層学習@認知科学会サマースクール言語と知識の深層学習@認知科学会サマースクール
言語と知識の深層学習@認知科学会サマースクール
 
[最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
[最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」 [最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
[最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
 
iYES オンラインプログラム
iYES オンラインプログラムiYES オンラインプログラム
iYES オンラインプログラム
 
20190324 第6章 テキストデータのための素性
20190324 第6章 テキストデータのための素性20190324 第6章 テキストデータのための素性
20190324 第6章 テキストデータのための素性
 
さくさくテキストマイニング入門セッション
さくさくテキストマイニング入門セッションさくさくテキストマイニング入門セッション
さくさくテキストマイニング入門セッション
 
Interspeech2022 参加報告
Interspeech2022 参加報告Interspeech2022 参加報告
Interspeech2022 参加報告
 
2014LETシンポジウム WritingMaetriXについて
2014LETシンポジウム WritingMaetriXについて2014LETシンポジウム WritingMaetriXについて
2014LETシンポジウム WritingMaetriXについて
 
1 3-2
1 3-21 3-2
1 3-2
 
[旧版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
[旧版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」 [旧版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
[旧版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
 
20190407 第7章 事例研究:自然言語処理における素性
20190407 第7章 事例研究:自然言語処理における素性20190407 第7章 事例研究:自然言語処理における素性
20190407 第7章 事例研究:自然言語処理における素性
 
データマイニングと外国語教育の接点としての自動採点研究
データマイニングと外国語教育の接点としての自動採点研究データマイニングと外国語教育の接点としての自動採点研究
データマイニングと外国語教育の接点としての自動採点研究
 
ちょっと明日のテストの話をしよう
ちょっと明日のテストの話をしようちょっと明日のテストの話をしよう
ちょっと明日のテストの話をしよう
 
Jacet2014ykondo_final
Jacet2014ykondo_finalJacet2014ykondo_final
Jacet2014ykondo_final
 
形態素解析
形態素解析形態素解析
形態素解析
 
Interop2017
Interop2017Interop2017
Interop2017
 
ゼロから始める自然言語処理 【FIT2016チュートリアル】
ゼロから始める自然言語処理 【FIT2016チュートリアル】ゼロから始める自然言語処理 【FIT2016チュートリアル】
ゼロから始める自然言語処理 【FIT2016チュートリアル】
 
VCWE[論文読み会]
VCWE[論文読み会]VCWE[論文読み会]
VCWE[論文読み会]
 
Kof2005 Presen
Kof2005 PresenKof2005 Presen
Kof2005 Presen
 
英語学習者のための発話自動採点システムの開発.
英語学習者のための発話自動採点システムの開発.英語学習者のための発話自動採点システムの開発.
英語学習者のための発話自動採点システムの開発.
 

More from Tomoyuki Kajiwara

文献紹介:格フレームの対応付けに基づく用言の言い換え
文献紹介:格フレームの対応付けに基づく用言の言い換え文献紹介:格フレームの対応付けに基づく用言の言い換え
文献紹介:格フレームの対応付けに基づく用言の言い換えTomoyuki Kajiwara
 
高頻度語は平易なのか?
高頻度語は平易なのか?高頻度語は平易なのか?
高頻度語は平易なのか?Tomoyuki Kajiwara
 
文脈の多様性に基づく名詞換言の提案
文脈の多様性に基づく名詞換言の提案文脈の多様性に基づく名詞換言の提案
文脈の多様性に基づく名詞換言の提案Tomoyuki Kajiwara
 
機械学習を用いたニ格深層格の自動付与の検討
機械学習を用いたニ格深層格の自動付与の検討機械学習を用いたニ格深層格の自動付与の検討
機械学習を用いたニ格深層格の自動付与の検討Tomoyuki Kajiwara
 
Selecting Proper Lexical Paraphrase for Children
Selecting Proper Lexical Paraphrase for ChildrenSelecting Proper Lexical Paraphrase for Children
Selecting Proper Lexical Paraphrase for ChildrenTomoyuki Kajiwara
 
小学生の読解支援に向けた語釈文から語彙的換言を選択する手法
小学生の読解支援に向けた語釈文から語彙的換言を選択する手法小学生の読解支援に向けた語釈文から語彙的換言を選択する手法
小学生の読解支援に向けた語釈文から語彙的換言を選択する手法Tomoyuki Kajiwara
 
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価Tomoyuki Kajiwara
 
対話型自動作曲システムに関する研究 -Aメロ, Bメロ, サビで異なる印象を感じさせる楽曲生成-
対話型自動作曲システムに関する研究 -Aメロ, Bメロ, サビで異なる印象を感じさせる楽曲生成-対話型自動作曲システムに関する研究 -Aメロ, Bメロ, サビで異なる印象を感じさせる楽曲生成-
対話型自動作曲システムに関する研究 -Aメロ, Bメロ, サビで異なる印象を感じさせる楽曲生成-Tomoyuki Kajiwara
 
IGAを用いた個人の感性を反映した楽曲作成に関する研究 -Aメロ, Bメロ, サビに異なる感性的印象を感じさせる楽曲生成手法-
IGAを用いた個人の感性を反映した楽曲作成に関する研究 -Aメロ, Bメロ, サビに異なる感性的印象を感じさせる楽曲生成手法-IGAを用いた個人の感性を反映した楽曲作成に関する研究 -Aメロ, Bメロ, サビに異なる感性的印象を感じさせる楽曲生成手法-
IGAを用いた個人の感性を反映した楽曲作成に関する研究 -Aメロ, Bメロ, サビに異なる感性的印象を感じさせる楽曲生成手法-Tomoyuki Kajiwara
 

More from Tomoyuki Kajiwara (11)

20190315 nlp
20190315 nlp20190315 nlp
20190315 nlp
 
20180208公聴会
20180208公聴会20180208公聴会
20180208公聴会
 
文献紹介:格フレームの対応付けに基づく用言の言い換え
文献紹介:格フレームの対応付けに基づく用言の言い換え文献紹介:格フレームの対応付けに基づく用言の言い換え
文献紹介:格フレームの対応付けに基づく用言の言い換え
 
高頻度語は平易なのか?
高頻度語は平易なのか?高頻度語は平易なのか?
高頻度語は平易なのか?
 
文脈の多様性に基づく名詞換言の提案
文脈の多様性に基づく名詞換言の提案文脈の多様性に基づく名詞換言の提案
文脈の多様性に基づく名詞換言の提案
 
機械学習を用いたニ格深層格の自動付与の検討
機械学習を用いたニ格深層格の自動付与の検討機械学習を用いたニ格深層格の自動付与の検討
機械学習を用いたニ格深層格の自動付与の検討
 
Selecting Proper Lexical Paraphrase for Children
Selecting Proper Lexical Paraphrase for ChildrenSelecting Proper Lexical Paraphrase for Children
Selecting Proper Lexical Paraphrase for Children
 
小学生の読解支援に向けた語釈文から語彙的換言を選択する手法
小学生の読解支援に向けた語釈文から語彙的換言を選択する手法小学生の読解支援に向けた語釈文から語彙的換言を選択する手法
小学生の読解支援に向けた語釈文から語彙的換言を選択する手法
 
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
 
対話型自動作曲システムに関する研究 -Aメロ, Bメロ, サビで異なる印象を感じさせる楽曲生成-
対話型自動作曲システムに関する研究 -Aメロ, Bメロ, サビで異なる印象を感じさせる楽曲生成-対話型自動作曲システムに関する研究 -Aメロ, Bメロ, サビで異なる印象を感じさせる楽曲生成-
対話型自動作曲システムに関する研究 -Aメロ, Bメロ, サビで異なる印象を感じさせる楽曲生成-
 
IGAを用いた個人の感性を反映した楽曲作成に関する研究 -Aメロ, Bメロ, サビに異なる感性的印象を感じさせる楽曲生成手法-
IGAを用いた個人の感性を反映した楽曲作成に関する研究 -Aメロ, Bメロ, サビに異なる感性的印象を感じさせる楽曲生成手法-IGAを用いた個人の感性を反映した楽曲作成に関する研究 -Aメロ, Bメロ, サビに異なる感性的印象を感じさせる楽曲生成手法-
IGAを用いた個人の感性を反映した楽曲作成に関する研究 -Aメロ, Bメロ, サビに異なる感性的印象を感じさせる楽曲生成手法-
 

日本語の語彙平易化システムおよび評価セットの構築