エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください
Twitterで共有ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
Hugging Faceを開いたら、Microsoftから登場したVibe Voice 1.5Bモデルがトレンドに上がってました。 気... Hugging Faceを開いたら、Microsoftから登場したVibe Voice 1.5Bモデルがトレンドに上がってました。 気になって調べてみたところめっちゃすごかったので紹介 Vibe Voice 1.5Bの特徴 1. 長尺生成 最大90分、4人の異なる話者による自然な会話が可能とのこと 2. モデルの軽さ 1.5Bとのことで軽そーとは思いましたが、GPU積んだPCで全然動くようです。 VRAMが8GBあれば十分動かせそうです。(RTX3060以上であればOK) ベースモデルはQwen2.5 1.5bモデルです。 3. オープンソース MITライセンスでHugging Faceから無料で自由に利用可能! 4. 出力音声の品質 めちゃくちゃ自然で感情のこもった音声を出力してくれます。 従来のTTSモデルにありがちな棒読みではありません。 動かしてみる GitHubに動かすためのコー