2015年4月 - 2017年3月

混合音に対する複数同時発話認識のための統一的ベイズアプローチ

日本学術振興会科学研究費助成事業挑戦的萌芽研究挑戦的萌芽研究

課題番号

15K12063

体系的番号

JP15K12063

配分額

(総額): 3,640,000円
(直接経費): 2,800,000円
(間接経費): 840,000円

本研究では、音源分離を確率的に統合した同時発話音声認識を行う手法を提案した。音源分離により復元される音声信号には不確実性が存在するため、音声信号の事後分布を考慮することで音声認識との統合を行う。これにより、復元すべき音声を一意に定めることなく混合音から直接認識結果を得ることが可能となった。また、音の重畳過程と音源モデルを内包する統合モデルにより、高精度な音源分離を行う手法を考案した。具体的には、重畳過程・音源モデルに対して、混合モデル (LDA) および因子モデル (NMF) のそれぞれのモデル化を行うことで、各モデルの音源分離性能を比較評価した。

リンク情報

URL: https://kaken.nii.ac.jp/file/KAKENHI-PROJECT-15K12063/15K12063seika.pdf
KAKEN: https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-15K12063

ID情報

課題番号 : 15K12063
体系的番号 : JP15K12063

持橋大地

共同研究・競争的資金等の研究課題

混合音に対する複数同時発話認識のための統一的ベイズアプローチ

メニュー

共著者の一覧

フォロー一覧