[フレーム]
はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く
  • はてなブックマーク
  • テクノロジー
  • 3秒の音声があれば本人そっくりの声で日本語・英語・中国語合成できる「VALL-E X」はやはり脅威。MSが非公開にした技術のOSS版を試して実感した(CloseBox) | テクノエッジ TechnoEdge

気に入った記事をブックマーク

  • 気に入った記事を保存できます
    保存した記事の一覧は、はてなブックマークで確認・編集ができます
  • 記事を読んだ感想やメモを書き残せます
  • 非公開でブックマークすることもできます
適切な情報に変更

エントリーの編集

loading...

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。

タイトルガイドライン

このページのオーナーなので以下のアクションを実行できます

タイトル、本文などの情報を
再取得することができます
コメントを非表示にできます コメント表示の設定

ブックマークしました

ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください

Twitterで共有

ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します

728users がブックマーク コメント 76

ガイドラインをご確認の上、良識あるコメントにご協力ください

0 / 0
入力したタグを追加

現在プライベートモードです 設定を変更する

おすすめタグタグについて

よく使うタグ

3秒の音声があれば本人そっくりの声で日本語・英語・中国語合成できる「VALL-E X」はやはり脅威。MSが非公開にした技術のOSS版を試して実感した(CloseBox) | テクノエッジ TechnoEdge

ガイドラインをご確認の上、良識あるコメントにご協力ください

0 / 0
入力したタグを追加

現在プライベートモードです 設定を変更する

おすすめタグタグについて

よく使うタグ

はてなブックマーク

はてなブックマークで
関心をシェアしよう

みんなの興味と感想が集まることで
新しい発見や、深堀りがもっと楽しく

ユーザー登録

アカウントをお持ちの方はログインページ

記事へのコメント76

  • 注目コメント
  • 新着コメント
hobbiel55
これは録音してたと称して偽の証拠を作り放題だな。本物の音声との判別ツールが必要。

その他
su_rusumi
もうすぐ本人の声も映像も精密に再現できるようになる。こうして「現実と仮想の違いがわからなくなる」が現実になる。

その他
FUKAMACHI
本当にパンドラの筺というか。特殊詐欺やってる連中、大喜びとしか。

その他
WildWideWeb
英語や中国語の標準話者の声だけ自分の物に差し替えできたら究極の学習モデルが提示されるわけで発音練習のやる気爆上がりだろうな、と昔夢想していた。世界を性善説で考えては生きていけない2023年の厳しさ。

その他
yujimi-daifuku-2222
本人の発言、と称したスクープも信用ならない時代が来てしまったのだなと。/政治的に対立する者同士が捏造の誘惑に抗えるかというと、見通しは明るくなさそうだ。

その他
hogeaegxa
パワハラの証拠とかで音声はもう使い物にならないだろうし、証拠無しで有罪にできるセクハラと違ってこれからは逆に泣き寝入りになるのかな

その他
babi1234567890
恐ろしいほど悪用されそう😰

その他
by-king
3秒間音の出し方を学習しただけに過ぎないんだから規制する必要はないでしょ、という論が成り立つ

その他
htnmiki
声を勝手に録音されないためのポータブルジャミング機器みたいなのが流行るんだろうか

その他
Byucky
偽造が不能な最高音質とか最高画質とかに価値が出てきそうだ。それらは得てしてハイコストだから、弱者泣き寝入りの構造でかなりよろしくない

その他
kei_1010
ガッカリ

その他
soitan
そんなに凄いのかと思ってウキウキで動画を確認したら全然で解散......

その他
nt46
まあ個人的には、初めて使ってみたいAI?が来たな、って感じだが。

その他
vegnpomn
とりあえず芸人の4秒ほどの音声読ませて殺害予告とか誹謗中傷を作ってみたけど、意味があるセリフとなるとアクセントとかが微妙で、今のところは悪用も限定されそうだ。今のところは

その他
mkotatsu
いずれは、と考えて対抗技術作ったり法整備したりする余裕はありそうだな

その他
Byucky
Byucky 偽造が不能な最高音質とか最高画質とかに価値が出てきそうだ。それらは得てしてハイコストだから、弱者泣き寝入りの構造でかなりよろしくない

2023年08月29日 リンク

その他
bigchu
学習ははやい

その他
zakunubo
録音を警戒して他人とは喋られなくなる時代が来るのか

その他
pekee-nuee-nuee
電話、本当に死ぬかもしれない......

その他
p_funny
耐タンパ性の高い証明書付き書ききりメディア使えば映像や音声が裁判で証拠能力失うなんて事はまずないよ。別にAI使わなくたって映像音声の改竄なんてとっくにできるからね

その他
kusigahama
デモ動画を最後まで見て、タイトルも記事も言い過ぎだと感じたけど、ブコメ煽られすぎじゃない?

その他
konnie
こういった、犯罪に使われると摘発が難しくなる系の技術はすべて利用する側に対しての免許性にするなどの対策を講じるべき。確実にこれで騙される人が増えるのは目に見えているわけなので。

その他
Yagokoro
悪用しか出来ねえような技術だな

その他
misshiki
"わずか3秒の元音声から本人そっくりな音声合成が可能な技術「VALL-E X」が誰でも使える形で公開されました。オープンソース版で、ローカルマシンからWebUIで利用できます。"

その他
lavandin
前にジョジョの日本人声優の声を英語に変換したやつがバズってたけど、英語だからかさっぱり似てると思えなくてポカーンだった...。これはもっと向上してるのかな?

その他
kotoripiyopiyo
ai

その他
hide_nico
"学習元の音声データが中国語、英語、日本語のいずれであっても、それぞれのネイティブ発音だけでなく、英語訛りの日本語、中国語訛りの英語、といった表現が可能になります。"

その他
kobito19
知らない電話番号には出ない、知らない人とは会話しない。これを破るのはパスワード使いまわしと同じ罪

その他
hearthewindsing
声優、ナレーションの仕事が激減するな。声の良さが問われなくなる。この技術でAIと会話するのは避けられない世界。

その他
hevohevo
来ちゃったか。OSSで出ることで機能はあっという間に向上・・・してしまうなぁ。裁判で録音データを証拠として使えなくなる時代が来るのね。あと、Youtuber関連の炎上でこれをネタとして使われそうな予感がしている。

その他
byod
死者の人形遊びが捗りますね。そして はてブが感動すると、、

その他
Nean
"パンドラの匣、完全に開いてしまった感ありますね。"/まんまぢゃ使途は限られるけれど、録音ファイル+電話経由ならばいろいろ悪さをするヒトが喜びそうな。無料だしぃ。

その他
onekosama_2021
まさに脅威。凄すぎる!

その他
will_in_hiki
Vtuberの月ノ美兎がRVCで動画作ってたな 【ドッキリ】変声機で自分の悪評バラまいてみたhttps://www.youtube.com/watch?v=aOqwCQignwA 月ノ美兎の演技力でカバーしてるとこあるけど

その他
julajp
画像生成AIと併せたりで、気合い入った二次創作できちゃうな〜。コンテンツホルダーは、二次利用について、色々検討声明出さないとだろうな〜。

その他
j1nsuke
ドンドン肉体の価値が上がっていくな

その他
Cru
会社に損害与えてしまったみたいな設定で話してる時に演算時間による長い沈黙はむしろ効果的だったりしないか。あとは短い受け答えを別に何通りか用意すれば...

その他
puruhime
なりすましできるからヤバいってコメント多いけど、ユーザお手製TTSならCOEIROINKやCoeFontでやろうと思えばやれる事なのよね。 危惧する内容が周回遅れしてる方がヤバいと思うよ

その他
otation
全部AI製のエロゲを作る夢が叶う?

その他
gcyn
『筆者はこれまで多様な音声合成ソフトを試してきましたが』(笑)! 『現時点ではこの非実用性がかろうじてフェイクボイスの壁となってくれているのかもしれません。しかしそれもごく短期間でしょう』

その他

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

リンクを埋め込む

以下のコードをコピーしてサイトに埋め込むことができます

プレビュー
アプリのスクリーンショット
いまの話題をアプリでチェック!
  • バナー広告なし
  • ミュート機能あり
  • ダークモード搭載
アプリをダウンロード

関連記事

usersに達しました!

さんが1番目にブックマークした記事「3秒の音声があれば...」が注目されています。

気持ちをシェアしよう

ツイートする

3秒の音声があれば本人そっくりの声で日本語・英語・中国語合成できる「VALL-E X」はやはり脅威。MSが非公開にした技術のOSS版を試して実感した(CloseBox) | テクノエッジ TechnoEdge

わずか3秒の元音声から人そっくりな音声合成が可能な技術「VALL-E X」が誰でも使える形で公開されまし... わずか3秒の元音声から人そっくりな音声合成が可能な技術「VALL-E X」が誰でも使える形で公開されました。オープンソース版で、ローカルマシンからWebUIで利用できます。さっそくインストールして使ってみました。 以前、ディープラーニングベースの音声・歌声合成ソフトであるDiff-SVC、リアルタイム処理が可能なAIボイチェンRVCを紹介したとき、自分は記事タイトルに「驚異の」という形容詞を付けました。それでも学習には数十分の人による音声データが必要で、そこまでのデータを用意するのは容易ではありません。それに対してVALL-E Xでは元データが3秒あれば人に似た声を生成できるのです。

ブックマークしたユーザー

  • moonblogger2024年02月07日 moonblogger
  • rodori2023年11月03日 rodori
  • shion2142023年10月27日 shion214
  • tkmt_kkc2023年10月25日 tkmt_kkc
  • nasumix2023年10月25日 nasumix
  • tarimoabc2023年10月03日 tarimoabc
  • pocopon2023年09月26日 pocopon
  • kwy2023年09月20日 kwy
  • mieki2562023年09月14日 mieki256
  • samurairodeo2023年09月11日 samurairodeo
  • masadream2023年09月10日 masadream
  • J1382023年09月09日 J138
  • kuimal2023年09月06日 kuimal
  • road1962023年09月05日 road196
  • Nyoho2023年09月03日 Nyoho
  • techtech05212023年09月01日 techtech0521
  • ahat19842023年09月01日 ahat1984
  • s10611232023年08月31日 s1061123
すべてのユーザーの
詳細を表示します

ブックマークしたすべてのユーザー

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

同時期にブックマークされた記事

いま人気の記事 - 企業メディア

企業メディアをもっと読む

はてなブックマーク

公式Twitter

はてなのサービス

Copyright © 2005-2025 Hatena. All Rights Reserved.
設定を変更しましたx

AltStyle によって変換されたページ (->オリジナル) /