大学の演習で「歌うボコーダ」を作る
2015年6月 4日 (木) 投稿者: メディア技術コース
みなさん、こんにちは、
図1 線形予測分析のしくみと、それを使ったボコーダ
線形予測フィルタというのは、人の声の中から予測できるものをすべて取り除くしくみです。もし、特定の周波数(振動数)の音声の成分が多く含まれていれば一定周期で変化しますから予測できてしまいます。ですから、予測誤差と呼ばれる予測できずに残ってくる成分は、含まれる音の周波数に偏りがありません。具体的には、声帯が開いた瞬間に流れ出す急激な気流に相当するパルス状の信号です。実はパルスはすべての周波数を均等に含むのです。
さて、こんなことで、どうして人の声が合成できるのでしょう?
音声から予測誤差である声帯のパルス列が求まる過程を説明しましたが、その逆過程は、声帯から瞬間的に流れ出す気流が口の中や鼻の中を通ることにより人の声になる仕組みそのものになっているのです。つまり、線形予測フィルタの逆特性のフィルタ「逆フィルタ」は、口や鼻の音響特性に相当するのです。
図2 パルスで発生する振動を並べると音声になる
学生のみなさんは演習でどんなことをするのかを紹介しましょう。
1.自分の声を複数個録音する。「め」でも「にゃー」でも何でもいいです。
2.線形予測分析で「逆フィルタ」を作ります。
3.歌わせたいメロディの音の周波数に応じたパルス列を用意します。
4.パルス列を「逆フィルタ」に入れれば1音符相当の声ができます。
5.音符をつなげれば歌になります。
演習で学生のみなさんに作ってもらったプログラムで発生させた歌声の例を紹介しましょう。ここでは「ま」という音声を使っています。「め」とか「ま」は日本語では101種類あります。すべて収録しておけば、歌詞をつけて歌わせることもできます!
「授業紹介」カテゴリの記事
- トップレベルの論文を読み込む「CG技術特論」(大学院授業紹介)(2019年03月13日)
- 大学院授業:プロシージャルアニメーション特論の紹介(2019年03月08日)
- 専門演習「空間インタラクティブコンテンツ」2018後期(3)(2019年02月22日)
- タンジブルインタラクションデザイン最終発表(2019年02月13日)
- 専門演習「空間インタラクティブコンテンツ」2018後期(2)(2019年02月12日)
「高校生向け」カテゴリの記事
- チュラロンコン大学からのインターン学生との再会(2019年03月14日)
- 大学院授業:プロシージャルアニメーション特論の紹介(2019年03月08日)
- ゲームの学会?!(2019年03月07日)
- 香港理工大学デザイン学部の紹介(2019年03月04日)
- 香港理工大学デザイン学部を訪問し、学部長Lee先生にお会いしました!(2019年03月03日)
RECENT ENTRY最新の投稿
- メディア学部の情報はこちら
- メディアコンテンツコースの情報はこちら
- メディア技術コースの情報はこちら
- メディア社会コースの情報はこちら
- 入試情報はこちら
- 資料請求はこちら(大学案内、募集要項等)
- 東京工科大学の情報はこちら