SlideShare a Scribd company logo
1 of 44
Download to read offline
スパース表現による音響信号処理


       亀岡弘和
  東京大学 大学院情報理工学系研究科
  日本電信電話株式会社
    NTTコミュニケーション科学基礎研究所
スパース表現                           基底関数
                 基底関数             Dictionary

1.データ       を     の形のモデルで表現

2.          がスパース (少数を除きほとんどが0)


        低ランクモデル
           複雑なデータセットを少ない基底で表現
                データ数    基底数




        基底のスパース正則化学習
           データに混在する独立な情報を抽出
スパース表現による音響信号処理
 実世界音響信号処理
  観測信号から現象を説明することが目的
  いかに実世界音響信号の構成音をうまくモデル化できるか

 メッセージ伝達媒体としての音
  離散的なシンボル情報を波形で表現し伝達                   実世界音響信号

     音声  音素単位 (/a/, /i/, /u/, ... )               ...
                                        音源A   音源B
     音楽  音階単位 (ド,レ,ミ,ファ, ...)
  各シンボルがどういう波形で表現されるかは

   音源に固有(すなわち未知)
                                        要素A   要素B   ...
 音源の仮定とモデル化
 (仮定)
音源信号は限られた種類のシンボル単位                  少ない基底関数の
に相当する未知の独立成分から成る                    スパースな重畳
発表のアウトライン
音源モデル化の基本方針:少ない基底関数のスパースな重ね合わせ

1. 複素NMF
  少数の振幅スペクトルの基底関数によって構成される
   音響信号モデル
  モノラル信号分離への適用例の紹介



2. 複合自己回帰系
  音声生成モデル(“ソースフィルタモデル”)における
   ソースとフィルタがそれぞれ少数の基底関数により
   構成される音声信号の統計モデル
  残響環境下のブラインド音源分離への適用例の紹介
発表のアウトライン
音源モデル化の基本方針:少ない基底関数のスパースな重ね合わせ

1. 複素NMF
  少数の振幅スペクトルの基底関数によって構成される
   音響信号モデル
  モノラル信号分離への適用例の紹介



2. 複合自己回帰系
  音声生成モデル(“ソースフィルタモデル”)における
   ソースとフィルタがそれぞれ少数の基底関数により
   構成される音声信号の統計モデル
  残響環境下のブラインド音源分離への適用例の紹介
振幅スペクトログラムの分解表現
 音響信号




                                    周波数→
                                           振幅スペクトログラム
      短時間フーリエ変換
      (時間周波数分解)

                                                 規則性が!
      絶対値をとる

     :時刻 に周波数 の成分が
      どれほど含まれているか




                                 各基底の
                               アクティビティ
                                                            時刻→



非負値行列因子分解 (NMF)
                         振幅スペクトル基底
                  周波数→




                                           低ランクスペクトログラム   基底数10
                                                          基底数30




     繰り返し生起する
  振幅スペクトルパターンが表出
                                                             時刻→
「複素NMF」の提案
音響信号                                   (波形同士は加法的)
      短時間フーリエ変換
                  ・・・線形な変換
      (時間周波数分解)
                                        (もちろん加法的)
      絶対値をとる      ・・・非線形な変換

      :時刻 に周波数 の成分が
       どれほど含まれているか
                                        (振幅スペクトル
                                        同士は非加法的)
NMFモデル

複素NMFモデル                            振幅スペクトル?
   複素スペクトログラム         をモデル化
                            行列積の形にならない!
                              (新しいクラスのスパース表現モデル)
複素NMFアルゴリズム
定義
 複素スペクトログラム
 振幅スペクトル基底    音響信号モデル
 位相スペクトログラム

 ゲイン



最適化問題




                   スパース正則化項
複素NMFアルゴリズム
補助関数法



 subject to
複素NMFアルゴリズム
補助関数法
              を満たす任意の定数




 subject to
複素NMFアルゴリズム
    補助関数法
                        を満たす任意の定数




          subject to

     回目の反復計算後のパラメータ値:

Step 1)



Step 2)
複素NMFアルゴリズム
    補助関数法
                        を満たす任意の定数




          subject to

     回目の反復計算後のパラメータ値:

Step 1)



Step 2)




                          は増加しない!
複素NMFアルゴリズム
    補助関数法
                        を満たす任意の定数




          subject to

     回目の反復計算後のパラメータ値:

Step 1)



Step 2)




                          は増加しない!
NMFと等価となる条件
Step 1)
                [条件1]
                  を          に
Step 2)         初期設定する

                              は
                Step1, Step2に対して
                不動点になっている!

[条件2]
Step 3)   を実行
                を満たす任意の定数
NMFと等価となる条件               複素NMFはNMFを包含
Step 1)
                                   [条件1]
                                     を         に
Step 2)                            初期設定する

                                                は
                                  Step1, Step2に対して
                                  不動点になっている!

[条件2]
Step 3)          を実行
                                   を満たす任意の定数




          Lee & Seungが導出したNMFアルゴリズム
                 [Lee & Seung 2000]と等価!
モノラル信号分離
デモンストレーション
「ソ」以外は音量オフ
「ソ」だけ音量オフ
一部の基底関数に対してのみスペクトル
伸縮変形を施し、混合信号を再構成
(スペクトル伸縮はピッチトランスポーズ
に相当。例えばトランスポーズ「-1」は、
半音下げという意味。)
発表のアウトライン
音源モデル化の基本方針:少ない基底関数のスパースな重ね合わせ

1. 複素NMF
  少数の振幅スペクトルの基底関数によって構成される
   音響信号モデル
  モノラル信号分離への適用例の紹介



2. 複合自己回帰系
  音声生成モデル(“ソースフィルタモデル”)における
   ソースとフィルタがそれぞれ少数の基底関数により
   構成される音声信号の統計モデル
  残響環境下のブラインド音源分離への適用例の紹介
発表のアウトライン
音源モデル化の基本方針:少ない基底関数のスパースな重ね合わせ

1. 複素NMF
  少数の振幅スペクトルの基底関数によって構成される
   音響信号モデル
  モノラル信号分離への適用例の紹介



2. 複合自己回帰系
  音声生成モデル(“ソースフィルタモデル”)における
   ソースとフィルタがそれぞれ少数の基底関数により
   構成される音声信号の統計モデル
  残響環境下のブラインド音源分離への適用例の紹介
目的: ブラインド音声強調のための音声モデリング
音源分離/残響除去・・・室内伝達系と音声信号が未知
  音声信号らしさの規準(モデル)をうまく仮定することが重要
  (例) 非ガウス性  独立成分分析に基づくブラインド音源分離

観測モデルの例 (マイクロホン数: M, 音源数: M)   [吉岡,中谷,三好 音講論(秋)’08]
 観測信号の時間周波数成分       残響除去フィルタ
                               ( : 周波数, : 時刻)
                         瞬時混合信号
   分離行列           音源成分


音源の確率モデル            を設計できれば...
目的: ブラインド音声強調のための音声モデリング
音源分離/残響除去・・・室内伝達系と音声信号が未知
  音声信号らしさの規準(モデル)をうまく仮定することが重要
  (例) 非ガウス性  独立成分分析に基づくブラインド音源分離

観測モデルの例 (マイクロホン数: M, 音源数: M)   [吉岡,中谷,三好 音講論(秋)’08]
 観測信号の時間周波数成分       残響除去フィルタ
                               ( : 周波数, : 時刻)
                         瞬時混合信号
   分離行列           音源成分


音源の確率モデル            を設計できれば...
    観測モデルに従って密度関数の変数変換
目的: ブラインド音声強調のための音声モデリング
音源分離/残響除去・・・室内伝達系と音声信号が未知
     音声信号らしさの規準(モデル)をうまく仮定することが重要
     (例) 非ガウス性  独立成分分析に基づくブラインド音源分離

観測モデルの例 (マイクロホン数: M, 音源数: M)      [吉岡,中谷,三好 音講論(秋)’08]
 観測信号の時間周波数成分        残響除去フィルタ
                                  ( : 周波数, : 時刻)
                           瞬時混合信号
      分離行列          音源成分


音源の確率モデル              を設計できれば...
       観測モデルに従って密度関数の変数変換
    仮定:     と              は独立
目的: ブラインド音声強調のための音声モデリング
音源分離/残響除去・・・室内伝達系と音声信号が未知
     音声信号らしさの規準(モデル)をうまく仮定することが重要
     (例) 非ガウス性  独立成分分析に基づくブラインド音源分離

観測モデルの例 (マイクロホン数: M, 音源数: M)      [吉岡,中谷,三好 音講論(秋)’08]
 観測信号の時間周波数成分        残響除去フィルタ
                                  ( : 周波数, : 時刻)
                           瞬時混合信号
      分離行列          音源成分


音源の確率モデル              を設計できれば...
       観測モデルに従って密度関数の変数変換
    仮定:     と              は独立
目的: ブラインド音声強調のための音声モデリング
音源分離/残響除去・・・室内伝達系と音声信号が未知
     音声信号らしさの規準(モデル)をうまく仮定することが重要
     (例) 非ガウス性  独立成分分析に基づくブラインド音源分離

観測モデルの例 (マイクロホン数: M, 音源数: M)        [吉岡,中谷,三好 音講論(秋)’08]
 観測信号の時間周波数成分           残響除去フィルタ
                                    ( : 周波数, : 時刻)
                             瞬時混合信号
      分離行列          音源成分


音源の確率モデル                を設計できれば...
       観測モデルに従って密度関数の変数変換
    仮定:     と                は独立



           音源分離&残響除去:              の最尤/MAP推定
目的: ブラインド音声強調のための音声モデリング
音源分離/残響除去・・・室内伝達系と音声信号が未知
     音声信号らしさの規準(モデル)をうまく仮定することが重要
     (例) 非ガウス性  独立成分分析に基づくブラインド音源分離

観測モデルの例 (マイクロホン数: M, 音源数: M) [吉岡,中谷,三好 音講論(秋)’08]
                音声の統計モデル
 観測信号の時間周波数成分         残響除去フィルタ
                     “複合自己回帰系”
                                ( : 周波数,   : 時刻)
                          の提案
                           瞬時混合信号
      分離行列          音源成分


音源の確率モデル                を設計できれば...
       観測モデルに従って密度関数の変数変換
    仮定:     と                は独立



           音源分離&残響除去:            の最尤/MAP推定
音声生成モデル(ソースフィルタモデル)
 自己回帰系による短時間フレーム 内の信号モデル


声帯による駆動源に対応            声道特性(音素)に対応
 定常Gauss過程              次の全極型モデル

 白色性
                       従来の自己回帰系      複合自己回帰系
                  フィ   フレームごとに別個
                  ルタ   の全極モデル

                       白色性を仮定
                       (パワースペクトル
                  入力   密度が平坦)
パワースペクトル密度(PSD)
音声生成モデル(ソースフィルタモデル)
 自己回帰系による短時間フレーム 内の信号モデル


声帯による駆動源に対応            声道特性(音素)に対応
 定常Gauss過程              次の全極型モデル

 白色性
                       従来の自己回帰系      複合自己回帰系
                  フィ   フレームごとに別個
                  ルタ   の全極モデル

                       白色性を仮定
                       (パワースペクトル
                  入力   密度が平坦)
パワースペクトル密度(PSD)          実際は違う!
音声生成モデル(ソースフィルタモデル)
 自己回帰系による短時間フレーム 内の信号モデル


声帯による駆動源に対応            声道特性(音素)に対応
 定常Gauss過程              次の全極型モデル

 白色性
                       従来の自己回帰系      複合自己回帰系
                  フィ   フレームごとに別個
                  ルタ   の全極モデル

                       白色性を仮定        パワースペクトル密度
                       (パワースペクトル     自体がパラメータ
                  入力   密度が平坦)
パワースペクトル密度(PSD)          実際は違う!
音声生成モデル(ソースフィルタモデル)
 自己回帰系による短時間フレーム 内の信号モデル


声帯による駆動源に対応            声道特性(音素)に対応
 定常Gauss過程              次の全極型モデル

 白色性
                       従来の自己回帰系      複合自己回帰系
                  フィ   フレームごとに別個     全フレームで高々J種類
                  ルタ   の全極モデル         の全極モデルを仮定

                       白色性を仮定        パワースペクトル密度
                       (パワースペクトル     自体がパラメータ
                  入力   密度が平坦)
パワースペクトル密度(PSD)          実際は違う!
音声生成モデル(ソースフィルタモデル)
 自己回帰系による短時間フレーム 内の信号モデル


声帯による駆動源に対応            声道特性(音素)に対応
 定常Gauss過程              次の全極型モデル

 白色性
                       従来の自己回帰系      複合自己回帰系
                  フィ   フレームごとに別個     全フレームで高々J種類
                  ルタ   の全極モデル         の全極モデルを仮定

                       白色性を仮定        パワースペクトル密度
                       (パワースペクトル     自体がパラメータ
                  入力   密度が平坦)        全フレームで高々I種類
パワースペクトル密度(PSD)          実際は違う!      のパワースペクトル密度
音声生成モデル(ソースフィルタモデル)
 自己回帰系による短時間フレーム 内の信号モデル


声帯による駆動源に対応            声道特性(音素)に対応
 定常Gauss過程              次の全極型モデル

 白色性                        音声では...
                           音素の種類は
                       framewise自己回帰系
                          限られている!       複合自己回帰系
                  フィ   フレームごとに別個        全フレームで高々J種類
                  ルタ   の全極モデル            の全極モデルを仮定
                         音声では...
                       白色性を仮定           パワースペクトル密度
                        ピッチの範囲は
                       (パワースペクトル        自体がパラメータ
                  入力    限られている!
                       密度が平坦)           全フレームで高々I種類
パワースペクトル密度(PSD)          実際は違う!         のパワースペクトル密度
複合自己回帰系による音声信号                     のモデル化
 駆動源信号           全極型フィルタ   アクティベーション
                                      個の
                                   要素信号
         Gauss
         雑音




                           スパース化
要素信号スペクトルの確率密度関数
                       全極型
   駆動源特性               フィルタ    要素信号
 PSD




                               PSD
                     PSD
           Gauss雑音




 ・駆動信号スペクトル :
 ・声道フィルタ通過後 :

 ・アクティベート後 :

  ここで,                     ,         とすると
音声信号スペクトルの確率密度関数
 要素信号       の和を音声信号   と考える


   と    は        のとき独立する




音声信号    の統計モデル
                      但し,

アクティベーションのスパースネスを保障する事前確率

                        (逆ガンマ分布)
音声信号スペクトルの確率密度関数通常のスパース表現モデル

 要素信号       の和を音声信号     と考える


   と    は        のとき独立する
                      logをとって少し式操作すると
                         と
                      の板倉斎藤距離になる

音声信号    の統計モデル
                         但し,

アクティベーションのスパースネスを保障する事前確率

                             (逆ガンマ分布)
EMアルゴリズムによる最適化




                 M番目の話者の
                 音声パワースペクトル密度推定値


(Step 1: 音源分離)   を固定


                       (Step 3: 音声パラメータ推定)   を固定
(Step 2: 残響除去)   を固定
                                      をEMアルゴリズムにより行う!
Step 3の詳細
Q関数



E-step      M-step
            [駆動源特性]


            [ゲイン]




            [自己回帰係数]
残響環境下ブラインド音源分離実験
実験条件


 パラメータの推定更新回数: 300回
 信号 : 2種類の日本語発話音声

  Src#1: 女性話者(8s),Src#2: 女性話者(8s)
 マイクロホン4本

 収音環境: 残響時間0.5ms

 信号の混合条件 (Signal-to-Interference Ratio)

            Mic#1   Mic#2   Mic#3   Mic#4
    Src#1   -0.59   -0.32   -0.14   +0.57
    Src#2   +0.59   +0.32   +0.14   -0.57   単位: [dB]
残響環境下ブラインド音源分離実験
実験結果
 ・混合条件
           Mic#1   Mic#2      Mic#3    Mic#4
   Src#1   -0.59   -0.32      -0.14     +0.57
   Src#2   +0.59   +0.32      +0.14     -0.57   単位: [dB]

 ・Src#1の分離性能 : SDR (Signal-to-Distortion ratio)
                    提案法          従来法
            SIR    +19.9 dB     +17.2 dB

 ・Src#2の残響除去性能: DRR (Direct-to-Reverberate ratio)
                    提案法           従来法
           DRR     +13.5 dB     +12.6 dB
まとめ (1/2)
実世界音響信号処理へのアプローチ

   実世界音響信号が何個かの統計的に独立な音源信号に
    よって構成されると仮定するのと同様に,各音源信号もまた
    何らかの離散的なシンボル情報に対応した何個かの独立
    成分によって構成される,と仮定
                        実世界音響信号
   実世界音響信号を階層的に独立
    な成分に分解したモデルで簡潔     音源A   音源B   ...
    に記述し,現象をモデルパラメータ
    最適化の視点から推論
                       要素A   要素B   ...
まとめ (2/2)
スパース表現の考え方をヒントにした新しい音響信号
モデルを提案               低ランク表現

通常のスパース表現モデル:


1. 複素NMF                     複素スペクトログラム
   NMFによる振幅スペクトログラム分解
   表現の特長をもつ複素スペクログラム
   の分解表現

2. 複合自己回帰系               パワースペクトログラム
   音声のソースフィルタモデルを
   ベースにした音声版の
   スパース表現モデル

More Related Content

What's hot

ランク1空間近似を用いたBSSにおける音源及び空間モデルの考察 Study on Source and Spatial Models for BSS wi...
ランク1空間近似を用いたBSSにおける音源及び空間モデルの考察 Study on Source and Spatial Models for BSS wi...ランク1空間近似を用いたBSSにおける音源及び空間モデルの考察 Study on Source and Spatial Models for BSS wi...
ランク1空間近似を用いたBSSにおける音源及び空間モデルの考察 Study on Source and Spatial Models for BSS wi...Daichi Kitamura
 
統計的独立性と低ランク行列分解理論に基づく ブラインド音源分離 –独立低ランク行列分析– Blind source separation based on...
統計的独立性と低ランク行列分解理論に基づくブラインド音源分離 –独立低ランク行列分析– Blind source separation based on...統計的独立性と低ランク行列分解理論に基づくブラインド音源分離 –独立低ランク行列分析– Blind source separation based on...
統計的独立性と低ランク行列分解理論に基づく ブラインド音源分離 –独立低ランク行列分析– Blind source separation based on...Daichi Kitamura
 
過決定条件BSSにおけるランク1空間制約の緩和 Relaxation of rank-1 spatial model in overdetermined...
過決定条件BSSにおけるランク1空間制約の緩和 Relaxation of rank-1 spatial model in overdetermined...過決定条件BSSにおけるランク1空間制約の緩和 Relaxation of rank-1 spatial model in overdetermined...
過決定条件BSSにおけるランク1空間制約の緩和 Relaxation of rank-1 spatial model in overdetermined...Daichi Kitamura
 
非負値行列因子分解を用いた被り音の抑圧
非負値行列因子分解を用いた被り音の抑圧非負値行列因子分解を用いた被り音の抑圧
非負値行列因子分解を用いた被り音の抑圧Kitamura Laboratory
 
Evaluation of separation accuracy for various real instruments based on super...
Evaluation of separation accuracy for various real instruments based on super...Evaluation of separation accuracy for various real instruments based on super...
Evaluation of separation accuracy for various real instruments based on super...Daichi Kitamura
 
基底変形型教師ありNMFによる実楽器信号分離 (in Japanese)
基底変形型教師ありNMFによる実楽器信号分離 (in Japanese)基底変形型教師ありNMFによる実楽器信号分離 (in Japanese)
基底変形型教師ありNMFによる実楽器信号分離 (in Japanese)Daichi Kitamura
 
局所時間周波数構造に基づく深層パーミュテーション解決法の実験的評価
局所時間周波数構造に基づく深層パーミュテーション解決法の実験的評価局所時間周波数構造に基づく深層パーミュテーション解決法の実験的評価
局所時間周波数構造に基づく深層パーミュテーション解決法の実験的評価Kitamura Laboratory
 
独立性基準を用いた非負値行列因子分解の効果的な初期値決定法(Statistical-independence-based efficient initia...
独立性基準を用いた非負値行列因子分解の効果的な初期値決定法(Statistical-independence-based efficient initia...独立性基準を用いた非負値行列因子分解の効果的な初期値決定法(Statistical-independence-based efficient initia...
独立性基準を用いた非負値行列因子分解の効果的な初期値決定法(Statistical-independence-based efficient initia...Daichi Kitamura
 
Optimal divergence diversity for superresolution-based nonnegative matrix fac...
Optimal divergence diversity for superresolution-based nonnegative matrix fac...Optimal divergence diversity for superresolution-based nonnegative matrix fac...
Optimal divergence diversity for superresolution-based nonnegative matrix fac...Daichi Kitamura
 
非負値行列因子分解に基づくブラインド及び教師あり音楽音源分離の効果的最適化法
非負値行列因子分解に基づくブラインド及び教師あり音楽音源分離の効果的最適化法非負値行列因子分解に基づくブラインド及び教師あり音楽音源分離の効果的最適化法
非負値行列因子分解に基づくブラインド及び教師あり音楽音源分離の効果的最適化法Daichi Kitamura
 
独立深層学習行列分析に基づく多チャネル音源分離の実験的評価(Experimental evaluation of multichannel audio s...
独立深層学習行列分析に基づく多チャネル音源分離の実験的評価(Experimental evaluation of multichannel audio s...独立深層学習行列分析に基づく多チャネル音源分離の実験的評価(Experimental evaluation of multichannel audio s...
独立深層学習行列分析に基づく多チャネル音源分離の実験的評価(Experimental evaluation of multichannel audio s...Daichi Kitamura
 
独立低ランク行列分析に基づく音源分離とその発展(Audio source separation based on independent low-rank...
独立低ランク行列分析に基づく音源分離とその発展(Audio source separation based on independent low-rank...独立低ランク行列分析に基づく音源分離とその発展(Audio source separation based on independent low-rank...
独立低ランク行列分析に基づく音源分離とその発展(Audio source separation based on independent low-rank...Daichi Kitamura
 
独立性に基づくブラインド音源分離の発展と独立低ランク行列分析 History of independence-based blind source sep...
独立性に基づくブラインド音源分離の発展と独立低ランク行列分析 History of independence-based blind source sep...独立性に基づくブラインド音源分離の発展と独立低ランク行列分析 History of independence-based blind source sep...
独立性に基づくブラインド音源分離の発展と独立低ランク行列分析 History of independence-based blind source sep...Daichi Kitamura
 
スペクトログラム無矛盾性を用いた 独立低ランク行列分析の実験的評価
スペクトログラム無矛盾性を用いた独立低ランク行列分析の実験的評価スペクトログラム無矛盾性を用いた独立低ランク行列分析の実験的評価
スペクトログラム無矛盾性を用いた 独立低ランク行列分析の実験的評価Daichi Kitamura
 
Interspeech2020 paper reading workshop "Similarity-and-Independence-Aware-Bea...
Interspeech2020 paper reading workshop "Similarity-and-Independence-Aware-Bea...Interspeech2020 paper reading workshop "Similarity-and-Independence-Aware-Bea...
Interspeech2020 paper reading workshop "Similarity-and-Independence-Aware-Bea...ssuserf54db1
 
音源分離における音響モデリング(Acoustic modeling in audio source separation)
音源分離における音響モデリング(Acoustic modeling in audio source separation)音源分離における音響モデリング(Acoustic modeling in audio source separation)
音源分離における音響モデリング(Acoustic modeling in audio source separation)Daichi Kitamura
 

What's hot (20)

ランク1空間近似を用いたBSSにおける音源及び空間モデルの考察 Study on Source and Spatial Models for BSS wi...
ランク1空間近似を用いたBSSにおける音源及び空間モデルの考察 Study on Source and Spatial Models for BSS wi...ランク1空間近似を用いたBSSにおける音源及び空間モデルの考察 Study on Source and Spatial Models for BSS wi...
ランク1空間近似を用いたBSSにおける音源及び空間モデルの考察 Study on Source and Spatial Models for BSS wi...
 
統計的独立性と低ランク行列分解理論に基づく ブラインド音源分離 –独立低ランク行列分析– Blind source separation based on...
統計的独立性と低ランク行列分解理論に基づくブラインド音源分離 –独立低ランク行列分析– Blind source separation based on...統計的独立性と低ランク行列分解理論に基づくブラインド音源分離 –独立低ランク行列分析– Blind source separation based on...
統計的独立性と低ランク行列分解理論に基づく ブラインド音源分離 –独立低ランク行列分析– Blind source separation based on...
 
過決定条件BSSにおけるランク1空間制約の緩和 Relaxation of rank-1 spatial model in overdetermined...
過決定条件BSSにおけるランク1空間制約の緩和 Relaxation of rank-1 spatial model in overdetermined...過決定条件BSSにおけるランク1空間制約の緩和 Relaxation of rank-1 spatial model in overdetermined...
過決定条件BSSにおけるランク1空間制約の緩和 Relaxation of rank-1 spatial model in overdetermined...
 
非負値行列因子分解を用いた被り音の抑圧
非負値行列因子分解を用いた被り音の抑圧非負値行列因子分解を用いた被り音の抑圧
非負値行列因子分解を用いた被り音の抑圧
 
Discriminative SNMF EA201603
Discriminative SNMF EA201603Discriminative SNMF EA201603
Discriminative SNMF EA201603
 
Evaluation of separation accuracy for various real instruments based on super...
Evaluation of separation accuracy for various real instruments based on super...Evaluation of separation accuracy for various real instruments based on super...
Evaluation of separation accuracy for various real instruments based on super...
 
基底変形型教師ありNMFによる実楽器信号分離 (in Japanese)
基底変形型教師ありNMFによる実楽器信号分離 (in Japanese)基底変形型教師ありNMFによる実楽器信号分離 (in Japanese)
基底変形型教師ありNMFによる実楽器信号分離 (in Japanese)
 
Asj2017 3invited
Asj2017 3invitedAsj2017 3invited
Asj2017 3invited
 
局所時間周波数構造に基づく深層パーミュテーション解決法の実験的評価
局所時間周波数構造に基づく深層パーミュテーション解決法の実験的評価局所時間周波数構造に基づく深層パーミュテーション解決法の実験的評価
局所時間周波数構造に基づく深層パーミュテーション解決法の実験的評価
 
独立性基準を用いた非負値行列因子分解の効果的な初期値決定法(Statistical-independence-based efficient initia...
独立性基準を用いた非負値行列因子分解の効果的な初期値決定法(Statistical-independence-based efficient initia...独立性基準を用いた非負値行列因子分解の効果的な初期値決定法(Statistical-independence-based efficient initia...
独立性基準を用いた非負値行列因子分解の効果的な初期値決定法(Statistical-independence-based efficient initia...
 
Optimal divergence diversity for superresolution-based nonnegative matrix fac...
Optimal divergence diversity for superresolution-based nonnegative matrix fac...Optimal divergence diversity for superresolution-based nonnegative matrix fac...
Optimal divergence diversity for superresolution-based nonnegative matrix fac...
 
非負値行列因子分解に基づくブラインド及び教師あり音楽音源分離の効果的最適化法
非負値行列因子分解に基づくブラインド及び教師あり音楽音源分離の効果的最適化法非負値行列因子分解に基づくブラインド及び教師あり音楽音源分離の効果的最適化法
非負値行列因子分解に基づくブラインド及び教師あり音楽音源分離の効果的最適化法
 
独立深層学習行列分析に基づく多チャネル音源分離の実験的評価(Experimental evaluation of multichannel audio s...
独立深層学習行列分析に基づく多チャネル音源分離の実験的評価(Experimental evaluation of multichannel audio s...独立深層学習行列分析に基づく多チャネル音源分離の実験的評価(Experimental evaluation of multichannel audio s...
独立深層学習行列分析に基づく多チャネル音源分離の実験的評価(Experimental evaluation of multichannel audio s...
 
独立低ランク行列分析に基づく音源分離とその発展(Audio source separation based on independent low-rank...
独立低ランク行列分析に基づく音源分離とその発展(Audio source separation based on independent low-rank...独立低ランク行列分析に基づく音源分離とその発展(Audio source separation based on independent low-rank...
独立低ランク行列分析に基づく音源分離とその発展(Audio source separation based on independent low-rank...
 
独立性に基づくブラインド音源分離の発展と独立低ランク行列分析 History of independence-based blind source sep...
独立性に基づくブラインド音源分離の発展と独立低ランク行列分析 History of independence-based blind source sep...独立性に基づくブラインド音源分離の発展と独立低ランク行列分析 History of independence-based blind source sep...
独立性に基づくブラインド音源分離の発展と独立低ランク行列分析 History of independence-based blind source sep...
 
スペクトログラム無矛盾性を用いた 独立低ランク行列分析の実験的評価
スペクトログラム無矛盾性を用いた独立低ランク行列分析の実験的評価スペクトログラム無矛盾性を用いた独立低ランク行列分析の実験的評価
スペクトログラム無矛盾性を用いた 独立低ランク行列分析の実験的評価
 
Interspeech2020 paper reading workshop "Similarity-and-Independence-Aware-Bea...
Interspeech2020 paper reading workshop "Similarity-and-Independence-Aware-Bea...Interspeech2020 paper reading workshop "Similarity-and-Independence-Aware-Bea...
Interspeech2020 paper reading workshop "Similarity-and-Independence-Aware-Bea...
 
Kameoka2017 ieice03
Kameoka2017 ieice03Kameoka2017 ieice03
Kameoka2017 ieice03
 
Kameoka2016 miru08
Kameoka2016 miru08Kameoka2016 miru08
Kameoka2016 miru08
 
音源分離における音響モデリング(Acoustic modeling in audio source separation)
音源分離における音響モデリング(Acoustic modeling in audio source separation)音源分離における音響モデリング(Acoustic modeling in audio source separation)
音源分離における音響モデリング(Acoustic modeling in audio source separation)
 

Viewers also liked

SIGGRAPH 2014 Preview -"Shape Collection" Session
SIGGRAPH 2014 Preview -"Shape Collection" SessionSIGGRAPH 2014 Preview -"Shape Collection" Session
SIGGRAPH 2014 Preview -"Shape Collection" SessionRyohei Suzuki
 
GPU上でのNLP向け深層学習の実装について
GPU上でのNLP向け深層学習の実装についてGPU上でのNLP向け深層学習の実装について
GPU上でのNLP向け深層学習の実装についてYuya Unno
 
Project_report_BSS
Project_report_BSSProject_report_BSS
Project_report_BSSKamal Bhagat
 
Blind Source Separation using Dictionary Learning
Blind Source Separation using Dictionary LearningBlind Source Separation using Dictionary Learning
Blind Source Separation using Dictionary LearningDavide Nardone
 
独立成分分析とPerfume
独立成分分析とPerfume独立成分分析とPerfume
独立成分分析とPerfumeYurie Oka
 
Numpy scipyで独立成分分析
Numpy scipyで独立成分分析Numpy scipyで独立成分分析
Numpy scipyで独立成分分析Shintaro Fukushima
 
111228 speech organ_slides
111228 speech organ_slides111228 speech organ_slides
111228 speech organ_slidesTomonari Kuroda
 
音声を検索するための索引付け方式の紹介(初心者向け)
音声を検索するための索引付け方式の紹介(初心者向け)音声を検索するための索引付け方式の紹介(初心者向け)
音声を検索するための索引付け方式の紹介(初心者向け)utsuro_lab
 
外国語としての音声言語理解とワーキングメモリ
外国語としての音声言語理解とワーキングメモリ外国語としての音声言語理解とワーキングメモリ
外国語としての音声言語理解とワーキングメモリKosuke Sugai
 
英語リスニング研究最前線:実験音声学からのアプローチ
英語リスニング研究最前線:実験音声学からのアプローチ英語リスニング研究最前線:実験音声学からのアプローチ
英語リスニング研究最前線:実験音声学からのアプローチKosuke Sugai
 
Gengo Africa
Gengo AfricaGengo Africa
Gengo AfricaYo Ehara
 
SocialDict @ 第3回SBM研究会
SocialDict @ 第3回SBM研究会SocialDict @ 第3回SBM研究会
SocialDict @ 第3回SBM研究会Yo Ehara
 
リスニング訓練法としての シャドーイングとリピーティング
リスニング訓練法としての シャドーイングとリピーティングリスニング訓練法としての シャドーイングとリピーティング
リスニング訓練法としての シャドーイングとリピーティングKosuke Sugai
 
日本語モーラの持続時間長: 単音節語提示による知覚実験(JSLS2015)
日本語モーラの持続時間長: 単音節語提示による知覚実験(JSLS2015)日本語モーラの持続時間長: 単音節語提示による知覚実験(JSLS2015)
日本語モーラの持続時間長: 単音節語提示による知覚実験(JSLS2015)Kosuke Sugai
 
破擦音生成時の解放に伴う破裂が摩擦音・破擦音識別に与える影響〜若年者と高齢者の比較〜
破擦音生成時の解放に伴う破裂が摩擦音・破擦音識別に与える影響〜若年者と高齢者の比較〜破擦音生成時の解放に伴う破裂が摩擦音・破擦音識別に与える影響〜若年者と高齢者の比較〜
破擦音生成時の解放に伴う破裂が摩擦音・破擦音識別に与える影響〜若年者と高齢者の比較〜Keiichi Yasu
 
ニューラルネットワークによる音声の分類
ニューラルネットワークによる音声の分類ニューラルネットワークによる音声の分類
ニューラルネットワークによる音声の分類yamaguchi_2048
 
HMMに基づく日本人英語音声合成における中学生徒の英語音声を用いた評価
HMMに基づく日本人英語音声合成における中学生徒の英語音声を用いた評価HMMに基づく日本人英語音声合成における中学生徒の英語音声を用いた評価
HMMに基づく日本人英語音声合成における中学生徒の英語音声を用いた評価Shinnosuke Takamichi
 
音声認識における言語モデル
音声認識における言語モデル音声認識における言語モデル
音声認識における言語モデルKOTARO SETOYAMA
 

Viewers also liked (20)

SIGGRAPH 2014 Preview -"Shape Collection" Session
SIGGRAPH 2014 Preview -"Shape Collection" SessionSIGGRAPH 2014 Preview -"Shape Collection" Session
SIGGRAPH 2014 Preview -"Shape Collection" Session
 
GPU上でのNLP向け深層学習の実装について
GPU上でのNLP向け深層学習の実装についてGPU上でのNLP向け深層学習の実装について
GPU上でのNLP向け深層学習の実装について
 
Presentation1
Presentation1Presentation1
Presentation1
 
Project_report_BSS
Project_report_BSSProject_report_BSS
Project_report_BSS
 
Blind Source Separation using Dictionary Learning
Blind Source Separation using Dictionary LearningBlind Source Separation using Dictionary Learning
Blind Source Separation using Dictionary Learning
 
独立成分分析とPerfume
独立成分分析とPerfume独立成分分析とPerfume
独立成分分析とPerfume
 
Numpy scipyで独立成分分析
Numpy scipyで独立成分分析Numpy scipyで独立成分分析
Numpy scipyで独立成分分析
 
MMIMPEsMBR
MMIMPEsMBRMMIMPEsMBR
MMIMPEsMBR
 
111228 speech organ_slides
111228 speech organ_slides111228 speech organ_slides
111228 speech organ_slides
 
音声を検索するための索引付け方式の紹介(初心者向け)
音声を検索するための索引付け方式の紹介(初心者向け)音声を検索するための索引付け方式の紹介(初心者向け)
音声を検索するための索引付け方式の紹介(初心者向け)
 
外国語としての音声言語理解とワーキングメモリ
外国語としての音声言語理解とワーキングメモリ外国語としての音声言語理解とワーキングメモリ
外国語としての音声言語理解とワーキングメモリ
 
英語リスニング研究最前線:実験音声学からのアプローチ
英語リスニング研究最前線:実験音声学からのアプローチ英語リスニング研究最前線:実験音声学からのアプローチ
英語リスニング研究最前線:実験音声学からのアプローチ
 
Gengo Africa
Gengo AfricaGengo Africa
Gengo Africa
 
SocialDict @ 第3回SBM研究会
SocialDict @ 第3回SBM研究会SocialDict @ 第3回SBM研究会
SocialDict @ 第3回SBM研究会
 
リスニング訓練法としての シャドーイングとリピーティング
リスニング訓練法としての シャドーイングとリピーティングリスニング訓練法としての シャドーイングとリピーティング
リスニング訓練法としての シャドーイングとリピーティング
 
日本語モーラの持続時間長: 単音節語提示による知覚実験(JSLS2015)
日本語モーラの持続時間長: 単音節語提示による知覚実験(JSLS2015)日本語モーラの持続時間長: 単音節語提示による知覚実験(JSLS2015)
日本語モーラの持続時間長: 単音節語提示による知覚実験(JSLS2015)
 
破擦音生成時の解放に伴う破裂が摩擦音・破擦音識別に与える影響〜若年者と高齢者の比較〜
破擦音生成時の解放に伴う破裂が摩擦音・破擦音識別に与える影響〜若年者と高齢者の比較〜破擦音生成時の解放に伴う破裂が摩擦音・破擦音識別に与える影響〜若年者と高齢者の比較〜
破擦音生成時の解放に伴う破裂が摩擦音・破擦音識別に与える影響〜若年者と高齢者の比較〜
 
ニューラルネットワークによる音声の分類
ニューラルネットワークによる音声の分類ニューラルネットワークによる音声の分類
ニューラルネットワークによる音声の分類
 
HMMに基づく日本人英語音声合成における中学生徒の英語音声を用いた評価
HMMに基づく日本人英語音声合成における中学生徒の英語音声を用いた評価HMMに基づく日本人英語音声合成における中学生徒の英語音声を用いた評価
HMMに基づく日本人英語音声合成における中学生徒の英語音声を用いた評価
 
音声認識における言語モデル
音声認識における言語モデル音声認識における言語モデル
音声認識における言語モデル
 

Similar to Kameoka2012 talk07 1

招待講演(鶴岡)
招待講演(鶴岡)招待講演(鶴岡)
招待講演(鶴岡)nozomuhamada
 
音情報処理における特徴表現
音情報処理における特徴表現音情報処理における特徴表現
音情報処理における特徴表現NU_I_TODALAB
 
高効率音声符号化―MP3詳解―
高効率音声符号化―MP3詳解―高効率音声符号化―MP3詳解―
高効率音声符号化―MP3詳解―Akinori Ito
 
音声の認識と合成
音声の認識と合成音声の認識と合成
音声の認識と合成Akinori Ito
 
音声認識の基礎
音声認識の基礎音声認識の基礎
音声認識の基礎Akinori Ito
 
独立低ランク行列分析に基づく音源分離とその発展
独立低ランク行列分析に基づく音源分離とその発展独立低ランク行列分析に基づく音源分離とその発展
独立低ランク行列分析に基づく音源分離とその発展Kitamura Laboratory
 
コサイン類似度罰則条件付き非負値行列因子分解に基づく音楽音源分離
コサイン類似度罰則条件付き非負値行列因子分解に基づく音楽音源分離コサイン類似度罰則条件付き非負値行列因子分解に基づく音楽音源分離
コサイン類似度罰則条件付き非負値行列因子分解に基づく音楽音源分離Kitamura Laboratory
 
複素ラプラス分布に基づく非負値行列因子分解
複素ラプラス分布に基づく非負値行列因子分解複素ラプラス分布に基づく非負値行列因子分解
複素ラプラス分布に基づく非負値行列因子分解Hiroki_Tanji
 
深層生成モデルに基づく音声合成技術
深層生成モデルに基づく音声合成技術深層生成モデルに基づく音声合成技術
深層生成モデルに基づく音声合成技術NU_I_TODALAB
 

Similar to Kameoka2012 talk07 1 (12)

招待講演(鶴岡)
招待講演(鶴岡)招待講演(鶴岡)
招待講演(鶴岡)
 
音情報処理における特徴表現
音情報処理における特徴表現音情報処理における特徴表現
音情報処理における特徴表現
 
Ssaw08 0513
Ssaw08 0513Ssaw08 0513
Ssaw08 0513
 
Ieice中国地区
Ieice中国地区Ieice中国地区
Ieice中国地区
 
高効率音声符号化―MP3詳解―
高効率音声符号化―MP3詳解―高効率音声符号化―MP3詳解―
高効率音声符号化―MP3詳解―
 
音声の認識と合成
音声の認識と合成音声の認識と合成
音声の認識と合成
 
音声認識の基礎
音声認識の基礎音声認識の基礎
音声認識の基礎
 
独立低ランク行列分析に基づく音源分離とその発展
独立低ランク行列分析に基づく音源分離とその発展独立低ランク行列分析に基づく音源分離とその発展
独立低ランク行列分析に基づく音源分離とその発展
 
コサイン類似度罰則条件付き非負値行列因子分解に基づく音楽音源分離
コサイン類似度罰則条件付き非負値行列因子分解に基づく音楽音源分離コサイン類似度罰則条件付き非負値行列因子分解に基づく音楽音源分離
コサイン類似度罰則条件付き非負値行列因子分解に基づく音楽音源分離
 
複素ラプラス分布に基づく非負値行列因子分解
複素ラプラス分布に基づく非負値行列因子分解複素ラプラス分布に基づく非負値行列因子分解
複素ラプラス分布に基づく非負値行列因子分解
 
pyssp
pyssppyssp
pyssp
 
深層生成モデルに基づく音声合成技術
深層生成モデルに基づく音声合成技術深層生成モデルに基づく音声合成技術
深層生成モデルに基づく音声合成技術
 

Kameoka2012 talk07 1