Submit Search
Upload
論文紹介 Building the Singapore English National Speech Corpus
•
1 like
•
995 views
Shinnosuke Takamichi
Follow
https://connpass.com/event/152316/
Read less
Read more
Technology
Report
Share
Report
Share
1 of 18
Download now
Download to read offline
Recommended
論文紹介 SANTLR: Speech Annotation Toolkit for Low Resource Languages
論文紹介 SANTLR: Speech Annotation Toolkit for Low Resource Languages
Shinnosuke Takamichi
JVS:フリーの日本語多数話者音声コーパス
JVS:フリーの日本語多数話者音声コーパス
Shinnosuke Takamichi
J-KAC:日本語オーディオブック・紙芝居朗読音声コーパス
J-KAC:日本語オーディオブック・紙芝居朗読音声コーパス
Shinnosuke Takamichi
日本語の語彙特性について
日本語の語彙特性について
AsakuraYasunobu
小学生の読解支援に向けた語釈文による換言
小学生の読解支援に向けた語釈文による換言
長岡技術科学大学 自然言語処理研究室
20180602 kawamura presentation_final
20180602 kawamura presentation_final
Yoshitake Misaki
音声合成研究を加速させるためのコーパスデザイン
音声合成研究を加速させるためのコーパスデザイン
Shinnosuke Takamichi
江戸時代のバーチャルリアリティ
江戸時代のバーチャルリアリティ
Tsukasa Makino
Recommended
論文紹介 SANTLR: Speech Annotation Toolkit for Low Resource Languages
論文紹介 SANTLR: Speech Annotation Toolkit for Low Resource Languages
Shinnosuke Takamichi
JVS:フリーの日本語多数話者音声コーパス
JVS:フリーの日本語多数話者音声コーパス
Shinnosuke Takamichi
J-KAC:日本語オーディオブック・紙芝居朗読音声コーパス
J-KAC:日本語オーディオブック・紙芝居朗読音声コーパス
Shinnosuke Takamichi
日本語の語彙特性について
日本語の語彙特性について
AsakuraYasunobu
小学生の読解支援に向けた語釈文による換言
小学生の読解支援に向けた語釈文による換言
長岡技術科学大学 自然言語処理研究室
20180602 kawamura presentation_final
20180602 kawamura presentation_final
Yoshitake Misaki
音声合成研究を加速させるためのコーパスデザイン
音声合成研究を加速させるためのコーパスデザイン
Shinnosuke Takamichi
江戸時代のバーチャルリアリティ
江戸時代のバーチャルリアリティ
Tsukasa Makino
公的文書に対する「やさしい日本語」換言辞書作成のための調査
公的文書に対する「やさしい日本語」換言辞書作成のための調査
長岡技術科学大学 自然言語処理研究室
インターンシップ体験談
インターンシップ体験談
iYES Corporation
Introduction to linguaphone 2013 mar
Introduction to linguaphone 2013 mar
Yoko Morisawa
レベル別文型指導法
レベル別文型指導法
別府大学
Jsss2019 openforum mkawasaki_distr
Jsss2019 openforum mkawasaki_distr
ssuserb24901
セッション1 イマージョン教室内での第二言語の学び方
セッション1 イマージョン教室内での第二言語の学び方
Mike Yamakawa
JTubeSpeech: 音声認識と話者照合のために YouTube から構築される日本語音声コーパス
JTubeSpeech: 音声認識と話者照合のために YouTube から構築される日本語音声コーパス
Shinnosuke Takamichi
音声合成のコーパスをつくろう
音声合成のコーパスをつくろう
Shinnosuke Takamichi
短時間発話を用いた話者照合のための音声加工の効果に関する検討
短時間発話を用いた話者照合のための音声加工の効果に関する検討
Shinnosuke Takamichi
リアルタイムDNN音声変換フィードバックによるキャラクタ性の獲得手法
リアルタイムDNN音声変換フィードバックによるキャラクタ性の獲得手法
Shinnosuke Takamichi
ここまで来た&これから来る音声合成 (明治大学 先端メディアコロキウム)
ここまで来た&これから来る音声合成 (明治大学 先端メディアコロキウム)
Shinnosuke Takamichi
国際会議 interspeech 2020 報告
国際会議 interspeech 2020 報告
Shinnosuke Takamichi
Interspeech 2020 読み会 "Incremental Text to Speech for Neural Sequence-to-Sequ...
Interspeech 2020 読み会 "Incremental Text to Speech for Neural Sequence-to-Sequ...
Shinnosuke Takamichi
サブバンドフィルタリングに基づくリアルタイム広帯域DNN声質変換の実装と評価
サブバンドフィルタリングに基づくリアルタイム広帯域DNN声質変換の実装と評価
Shinnosuke Takamichi
P J S: 音素バランスを考慮した日本語歌声コーパス
P J S: 音素バランスを考慮した日本語歌声コーパス
Shinnosuke Takamichi
音響モデル尤度に基づくsubword分割の韻律推定精度における評価
音響モデル尤度に基づくsubword分割の韻律推定精度における評価
Shinnosuke Takamichi
論文紹介 Unsupervised training of neural mask-based beamforming
論文紹介 Unsupervised training of neural mask-based beamforming
Shinnosuke Takamichi
話者V2S攻撃: 話者認証から構築される 声質変換とその音声なりすまし可能性の評価
話者V2S攻撃: 話者認証から構築される 声質変換とその音声なりすまし可能性の評価
Shinnosuke Takamichi
差分スペクトル法に基づく DNN 声質変換の計算量削減に向けたフィルタ推定
差分スペクトル法に基づく DNN 声質変換の計算量削減に向けたフィルタ推定
Shinnosuke Takamichi
音声合成・変換の国際コンペティションへの 参加を振り返って
音声合成・変換の国際コンペティションへの 参加を振り返って
Shinnosuke Takamichi
ユーザ歌唱のための generative moment matching network に基づく neural double-tracking
ユーザ歌唱のための generative moment matching network に基づく neural double-tracking
Shinnosuke Takamichi
End-to-end 韻律推定に向けた DNN 音響モデルに基づく subword 分割
End-to-end 韻律推定に向けた DNN 音響モデルに基づく subword 分割
Shinnosuke Takamichi
More Related Content
Similar to 論文紹介 Building the Singapore English National Speech Corpus
公的文書に対する「やさしい日本語」換言辞書作成のための調査
公的文書に対する「やさしい日本語」換言辞書作成のための調査
長岡技術科学大学 自然言語処理研究室
インターンシップ体験談
インターンシップ体験談
iYES Corporation
Introduction to linguaphone 2013 mar
Introduction to linguaphone 2013 mar
Yoko Morisawa
レベル別文型指導法
レベル別文型指導法
別府大学
Jsss2019 openforum mkawasaki_distr
Jsss2019 openforum mkawasaki_distr
ssuserb24901
セッション1 イマージョン教室内での第二言語の学び方
セッション1 イマージョン教室内での第二言語の学び方
Mike Yamakawa
Similar to 論文紹介 Building the Singapore English National Speech Corpus
(6)
公的文書に対する「やさしい日本語」換言辞書作成のための調査
公的文書に対する「やさしい日本語」換言辞書作成のための調査
インターンシップ体験談
インターンシップ体験談
Introduction to linguaphone 2013 mar
Introduction to linguaphone 2013 mar
レベル別文型指導法
レベル別文型指導法
Jsss2019 openforum mkawasaki_distr
Jsss2019 openforum mkawasaki_distr
セッション1 イマージョン教室内での第二言語の学び方
セッション1 イマージョン教室内での第二言語の学び方
More from Shinnosuke Takamichi
JTubeSpeech: 音声認識と話者照合のために YouTube から構築される日本語音声コーパス
JTubeSpeech: 音声認識と話者照合のために YouTube から構築される日本語音声コーパス
Shinnosuke Takamichi
音声合成のコーパスをつくろう
音声合成のコーパスをつくろう
Shinnosuke Takamichi
短時間発話を用いた話者照合のための音声加工の効果に関する検討
短時間発話を用いた話者照合のための音声加工の効果に関する検討
Shinnosuke Takamichi
リアルタイムDNN音声変換フィードバックによるキャラクタ性の獲得手法
リアルタイムDNN音声変換フィードバックによるキャラクタ性の獲得手法
Shinnosuke Takamichi
ここまで来た&これから来る音声合成 (明治大学 先端メディアコロキウム)
ここまで来た&これから来る音声合成 (明治大学 先端メディアコロキウム)
Shinnosuke Takamichi
国際会議 interspeech 2020 報告
国際会議 interspeech 2020 報告
Shinnosuke Takamichi
Interspeech 2020 読み会 "Incremental Text to Speech for Neural Sequence-to-Sequ...
Interspeech 2020 読み会 "Incremental Text to Speech for Neural Sequence-to-Sequ...
Shinnosuke Takamichi
サブバンドフィルタリングに基づくリアルタイム広帯域DNN声質変換の実装と評価
サブバンドフィルタリングに基づくリアルタイム広帯域DNN声質変換の実装と評価
Shinnosuke Takamichi
P J S: 音素バランスを考慮した日本語歌声コーパス
P J S: 音素バランスを考慮した日本語歌声コーパス
Shinnosuke Takamichi
音響モデル尤度に基づくsubword分割の韻律推定精度における評価
音響モデル尤度に基づくsubword分割の韻律推定精度における評価
Shinnosuke Takamichi
論文紹介 Unsupervised training of neural mask-based beamforming
論文紹介 Unsupervised training of neural mask-based beamforming
Shinnosuke Takamichi
話者V2S攻撃: 話者認証から構築される 声質変換とその音声なりすまし可能性の評価
話者V2S攻撃: 話者認証から構築される 声質変換とその音声なりすまし可能性の評価
Shinnosuke Takamichi
差分スペクトル法に基づく DNN 声質変換の計算量削減に向けたフィルタ推定
差分スペクトル法に基づく DNN 声質変換の計算量削減に向けたフィルタ推定
Shinnosuke Takamichi
音声合成・変換の国際コンペティションへの 参加を振り返って
音声合成・変換の国際コンペティションへの 参加を振り返って
Shinnosuke Takamichi
ユーザ歌唱のための generative moment matching network に基づく neural double-tracking
ユーザ歌唱のための generative moment matching network に基づく neural double-tracking
Shinnosuke Takamichi
End-to-end 韻律推定に向けた DNN 音響モデルに基づく subword 分割
End-to-end 韻律推定に向けた DNN 音響モデルに基づく subword 分割
Shinnosuke Takamichi
統計的ボイチェン研究事情
統計的ボイチェン研究事情
Shinnosuke Takamichi
テキスト音声合成技術と多様性への挑戦 (名古屋大学 知能システム特論)
テキスト音声合成技術と多様性への挑戦 (名古屋大学 知能システム特論)
Shinnosuke Takamichi
統計的音声合成変換と近年の発展
統計的音声合成変換と近年の発展
Shinnosuke Takamichi
音声コーパス設計と次世代音声研究に向けた提言
音声コーパス設計と次世代音声研究に向けた提言
Shinnosuke Takamichi
More from Shinnosuke Takamichi
(20)
JTubeSpeech: 音声認識と話者照合のために YouTube から構築される日本語音声コーパス
JTubeSpeech: 音声認識と話者照合のために YouTube から構築される日本語音声コーパス
音声合成のコーパスをつくろう
音声合成のコーパスをつくろう
短時間発話を用いた話者照合のための音声加工の効果に関する検討
短時間発話を用いた話者照合のための音声加工の効果に関する検討
リアルタイムDNN音声変換フィードバックによるキャラクタ性の獲得手法
リアルタイムDNN音声変換フィードバックによるキャラクタ性の獲得手法
ここまで来た&これから来る音声合成 (明治大学 先端メディアコロキウム)
ここまで来た&これから来る音声合成 (明治大学 先端メディアコロキウム)
国際会議 interspeech 2020 報告
国際会議 interspeech 2020 報告
Interspeech 2020 読み会 "Incremental Text to Speech for Neural Sequence-to-Sequ...
Interspeech 2020 読み会 "Incremental Text to Speech for Neural Sequence-to-Sequ...
サブバンドフィルタリングに基づくリアルタイム広帯域DNN声質変換の実装と評価
サブバンドフィルタリングに基づくリアルタイム広帯域DNN声質変換の実装と評価
P J S: 音素バランスを考慮した日本語歌声コーパス
P J S: 音素バランスを考慮した日本語歌声コーパス
音響モデル尤度に基づくsubword分割の韻律推定精度における評価
音響モデル尤度に基づくsubword分割の韻律推定精度における評価
論文紹介 Unsupervised training of neural mask-based beamforming
論文紹介 Unsupervised training of neural mask-based beamforming
話者V2S攻撃: 話者認証から構築される 声質変換とその音声なりすまし可能性の評価
話者V2S攻撃: 話者認証から構築される 声質変換とその音声なりすまし可能性の評価
差分スペクトル法に基づく DNN 声質変換の計算量削減に向けたフィルタ推定
差分スペクトル法に基づく DNN 声質変換の計算量削減に向けたフィルタ推定
音声合成・変換の国際コンペティションへの 参加を振り返って
音声合成・変換の国際コンペティションへの 参加を振り返って
ユーザ歌唱のための generative moment matching network に基づく neural double-tracking
ユーザ歌唱のための generative moment matching network に基づく neural double-tracking
End-to-end 韻律推定に向けた DNN 音響モデルに基づく subword 分割
End-to-end 韻律推定に向けた DNN 音響モデルに基づく subword 分割
統計的ボイチェン研究事情
統計的ボイチェン研究事情
テキスト音声合成技術と多様性への挑戦 (名古屋大学 知能システム特論)
テキスト音声合成技術と多様性への挑戦 (名古屋大学 知能システム特論)
統計的音声合成変換と近年の発展
統計的音声合成変換と近年の発展
音声コーパス設計と次世代音声研究に向けた提言
音声コーパス設計と次世代音声研究に向けた提言
Recently uploaded
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
iPride Co., Ltd.
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
Toru Tamaki
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
Hiroki Ichikura
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
Toru Tamaki
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
Ryo Sasaki
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
taisei2219
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Yuma Ohgami
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
sugiuralab
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
Toru Tamaki
Recently uploaded
(9)
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介 Building the Singapore English National Speech Corpus
1.
論文紹介(リソース系1) Building the Singapore
English National Speech Corpus 奈良先端科学技術大学院大学 知能コミュニケーション研究室 博士後期課程2年 柳田智也
2.
自己紹介 名前 柳田智也 所属 奈良先端科学技術大学院大学 知能コミュニケーション研究室D2 専門分野 逐次音声合成 2019/11/24 INTERSPEECH2019&サテライト論文読み会 ©TOMOYA YANAGITA 2
3.
今回の発表論文 2019/11/24 INTERSPEECH2019&サテライト論文読み会 ©TOMOYA YANAGITA 5
4.
論文選択の理由 個人的にシンガポール英語に興味があった シンガポールの公用語 →英語・マレー語・マンダリン・タミル語 主な民族構成 →マレー系・中華系 ・インド系 シンがポール英語 →多言語の発音や語彙文法が混同 →通常の認識タスクより困難、コードスイッチの発生(本論文の範囲外) →収録・アノテーション等どのように行うのか? 2019/11/24 INTERSPEECH2019&サテライト論文読み会 ©TOMOYA YANAGITA
6 [Google mapより参照] [コーパスより参照] “The ‘Swat team’ members can come from different institutions in Singapore both public and private sectors.”
5.
論文要約 シンガポール →公用語はマレーシアだが、英語も併用(36.9%の家庭会話で使用) →非ネイティブアクセントを含む大規模コーパス(-1000h)無 大規模コーパスNSC(National Speech Corpus)の構築 ①音素バランス読み上げ文(PB,1000h) ②固有表現を含む読み上げ文(LW,1000h) ③会話や自由発話(CS,1000) 活用事例 →シンガポール音声認識用の語彙辞書を作成 →コーパスに含有 2019/11/24 INTERSPEECH2019&サテライト論文読み会 ©TOMOYA
YANAGITA 7 コーパス名 時間 NIECSSE 3.5h GSSEC 8h CALL 125h
6.
シンガポール →公用語はマレーシアだが、英語も併用(36.9%の家庭会話で使用) →非ネイティブアクセントを含む大規模コーパス(-1000h)無 大規模コーパスNSC(National Speech Corpus)の構築 ①音素バランス読み上げ文(PB,1000h) ②固有表現を含む読み上げ文(LW,1000h) ③会話や自由発話(CS,1000) 活用事例 →シンガポール音声認識用の語彙辞書を作成 →コーパスに含有 コーパス名
時間 NIECSSE[1] 3.5h GSSEC[2] 8h CALL[3] 125h 論文要約 2019/11/24 INTERSPEECH2019&サテライト論文読み会 ©TOMOYA YANAGITA 8
7.
読み上げ収録環境 話者について →総計1379話者、以下の条件 ・シンガポール在住(18年間) ・英語の正式な教育(6年間) ・読み書き可 収録環境について →様々な環境で、3チャンネルで録音 ・ヘッドセットマイクorスタンドマイク(48kHz -> 16kHz;
16bit) ・ファーフィールドマイク(48kHz -> 16kHz; 16bits) ・携帯電話(16kHz 16bits) その他 →各話者PBで800文・LWで896文を録音 →マイクと音質を定期的に確認 →おおよその話者は、別個の二日間で収録 2019/11/24 INTERSPEECH2019&サテライト論文読み会 ©TOMOYA YANAGITA 9
8.
読み上げコーパスの分析(1/2) 2019/11/24 INTERSPEECH2019&サテライト論文読み会 ©TOMOYA YANAGITA 10 性別 →性別分布はおよそ50% 民族構成の分布 →主要な考慮事項 →マレーシアとインド話者割合を増加 →主要な少数民族のデータ量制限を防止、コーパスの有用性向上 人種
目標 実構成 PB LW 中国 50.0% 74.3% 60.7% 60.4% マレー 20.0-25.0% 13.4% 19.3% 19.4% インド 20.0-25.0% 9.0% 19.3% 19.4% その他 0.0-5.0% 3.4% 0.7% 0.9% 表1 民族分布ごとの話者の割合
9.
読み上げコーパスの分析(2/2) 2019/11/24 INTERSPEECH2019&サテライト論文読み会 ©TOMOYA YANAGITA 11 年齢 学歴 学歴
PB LW 大学以上 42.4% 42.2% 短大・ポリテク 41.3% 42.0% 中等学校以下 16.3% 15.8% 表3 学歴ごとの話者の割合 年齢 PB LW 18-30 51.2% 50.0% 31-45 30.0% 30.8% >46 18.8% 19.2% 表2 年齢ごとの話者の割合
10.
コーパス設計方法 PBについて → 音素バランス文となるようwebより選択( 72000文) →シンガポール英語の音素を表現する文章を選択(200文) →8回以上の同文の読み上げ(200文) LCについて →固有表現認識のため構築 →音声認識の外来語による未知語を防止 →シンガポールでの地名、住所、食べ物、著名人等を含む 2019/11/24 INTERSPEECH2019&サテライト論文読み会 ©TOMOYA
YANAGITA 12
11.
転記とその他情報の付与 2019/11/24 INTERSPEECH2019&サテライト論文読み会 ©TOMOYA YANAGITA 13 転記について →
人手で転記を作成 →正確性は単語単位で決定 →スペル誤りの修正は現在取り組んでいる その他情報について →excelファイルとして提供 →話者情報、性別、学歴、収録機器等を包含
12.
シンガポール →公用語はマレーシアだが、英語も併用(36.9%の家庭会話で使用) →非ネイティブアクセントを含む大規模コーパス(-1000h)無 大規模コーパスNSC(National Speech Corpus)の構築 ①音素バランス読み上げ文(PB,1000h) ②固有表現を含む読み上げ文(LW,1000h) ③会話や自由発話(CS,1000) 活用事例 →シンガポール音声認識用の語彙辞書を作成 →コーパスに含有 コーパス名
時間 NIECSSE[1] 3.5h GSSEC[2] 8h CALL[3] 125h 論文要約 2019/11/24 INTERSPEECH2019&サテライト論文読み会 ©TOMOYA YANAGITA 14
13.
音声認識用語彙辞書の作成 語彙数について →PBは約30000単語 →LWは約22200単語 音声認識用の単語辞書作成 →英語以外の音素転記のため、子音と母音を追加 →PBは、イギリス英語から音素表記を概算 →LWは、自動音素表記後、言語学者が修正 3 シンガポール英語での固有表現の特徴 →発音の多くが、在住民族の言語依存 →標準的発音の発見が困難 →複数の表記を使用 2019/11/24 INTERSPEECH2019&サテライト論文読み会 ©TOMOYA YANAGITA 15
14.
シンガポール →公用語はマレーシアだが、英語も併用(36.9%の家庭会話で使用) →非ネイティブアクセントを含む大規模コーパス(-1000h)無 大規模コーパスNSC(National Speech Corpus)の構築 ①音素バランス読み上げ文(PB,1000h) ②固有表現を含む読み上げ文(LW,1000h) ③会話や自由発話(CS,1000) 活用事例 →マレーシア音声認識用の語彙辞書を作成 →コーパスに含有 コーパス名
時間 NIECSSE[1] 3.5h GSSEC[2] 8h CALL[3] 125h 論文要約 2019/11/24 INTERSPEECH2019&サテライト論文読み会 ©TOMOYA YANAGITA 16
15.
会話・自由発話コーパス コーパス設計 →2h×250組×2条件、総計1000時間 ・対面会話(FTF: Face To
Face) ・電話録音(Tel.: Telecommunication) 発話の話題 ・Spot-the-difference diapix(2つの似た写真から差異部分の発見) ・カードゲーム ・自由発話 収録条件および録音環境 →長時間話せる関係・録音の参加は一度のみ →一部話者には、異なる民族のパートナ参加を強要 →マイク(48kHz->16kHz;16bits)と電話(8kHz;8bits)で録音 2019/11/24 INTERSPEECH2019&サテライト論文読み会 ©TOMOYA YANAGITA 17
16.
CSコーパスの分析及び問題 読み上げコーパスと同様の分析(性別・民族・学歴・年齢) 2019/11/24 INTERSPEECH2019&サテライト論文読み会 ©TOMOYA YANAGITA 18 一度目の書き起こしは終了、下記の件への対応が不十分 →地方特有な表現の標準化、不完全な単語や発音への処理 →コードスイッチング(言語切り替え)への対処 人種
FTF Tel. 全体 中国 58.8% 58.9% 58.8% マレー 20.0% 20.7% 20.4% インド 20.6% 18.9% 19.8% その他 0.6% 1.6% 1.1% 表6 民族分布ごとの話者の割合 性別 FTF Tel. 全体 男 52.5% 54.9% 53.7% 女 47.5% 45.1% 46.3% 表5 性別ごとの話者の割合 学歴 FTF Tel. 全体 大学以上 49.0% 39.8% 44.4% 短大・ポリテク 31.9% 38.8% 35.3% 中等学校以下 19.1% 21.5% 20.3% 表8 学歴ごとの話者の割合 年齢 FTF Tel. 全体 18-30 49.0% 46.9% 48.0% 31-45 29.4% 32.0% 30.7% >46 21.6% 21.1% 21.3% 表7 年齢ごとの話者の割合
17.
まとめ 背景 →シンガポール英語の大規模コーパス作成 コーパスの構築 →読み上げコーパスと、対話コーパスの構築 →少数の民族を多めに取得、有用性を拡張 →読み上げコーパスは、書き起こしが完了、語彙辞書も追加 →対話コーパスは、コードスイッチングへの対応が未達成 個人的な見解 →より困難な音声処理タスクへの挑戦(コードスイッチング等) →困難な問題への取り組みや、コーパス作成がより重要に 2019/11/24 INTERSPEECH2019&サテライト論文読み会 ©TOMOYA YANAGITA 19
18.
End of Slide 2019/11/24 INTERSPEECH2019&サテライト論文読み会 ©TOMOYA
YANAGITA 20
Download now