ChatGPTを試していて、想像以上に受け答えがしっかりしている印象を持ちました。入力と出力を音声に置き換えてアレクサのように応答できれば、音声ベースでAIと対話できるのでは?と思い、プログラムを作ってみました。 作ったもの プログラムを起動し、音声で問いかけることで音声でメッセージが返ってきます。 音声出力の方法としてボイスロイドを用いました。このツイートの例ではVOICEVOXの「春日部つむぎ」にしゃべってもらっています。 作り方 やることはシンプルで↓のような流れになります。 音声の入力を受けつけ、なるべく正確にテキストに変換する ChatGPTにそのテキストを送信し、返答を受け取る 返ってきたメッセージをVOICEVOXのメッセージ合成APIに送信し、合成後のメッセージを.wav形式で保存する プログラム内でその.wavファイルを再生する 上記の流れをループさせることで、何回でも対