共同研究・競争的資金等の研究課題

2015年4月 - 2017年3月

混合音に対する複数同時発話認識のための統一的ベイズアプローチ

日本学術振興会 科学研究費助成事業 挑戦的萌芽研究 挑戦的萌芽研究

課題番号
15K12063
体系的番号
JP15K12063
配分額
(総額)
3,640,000円
(直接経費)
2,800,000円
(間接経費)
840,000円

本研究では、音源分離を確率的に統合した同時発話音声認識を行う手法を提案した。音源分離により復元される音声信号には不確実性が存在するため、音声信号の事後分布を考慮することで音声認識との統合を行う。これにより、復元すべき音声を一意に定めることなく混合音から直接認識結果を得ることが可能となった。また、音の重畳過程と音源モデルを内包する統合モデルにより、高精度な音源分離を行う手法を考案した。具体的には、重畳過程・音源モデルに対して、混合モデル (LDA) および因子モデル (NMF) のそれぞれのモデル化を行うことで、各モデルの音源分離性能を比較評価した。

リンク情報
URL
https://kaken.nii.ac.jp/file/KAKENHI-PROJECT-15K12063/15K12063seika.pdf
KAKEN
https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-15K12063
ID情報
  • 課題番号 : 15K12063
  • 体系的番号 : JP15K12063