pyannote.audioで簡単話者分離〜whisperを添えて〜 - Qiita

テクノロジーカテゴリーの変更を依頼記事元:qiita.com/sayo0127

適切な情報に変更

エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。

このページのオーナーなので以下のアクションを実行できます

タイトル、本文などの情報を
再取得することができます

コメントを非表示にできますコメント表示の設定

ブックマークしました

ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください

Twitterで共有

次回からTwitterへ自動リダイレクト

ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します

14users がブックマークコメント 2

ゲスト

コメントするにはログインが必要ですブックマークを追加

ブックマークを追加

よく使うタグ

pyannote.audioで簡単話者分離〜whisperを添えて〜 - Qiita

14 users qiita.com/sayo0127

よく使うタグ

はてなブックマーク

はてなブックマークで
関心をシェアしよう

みんなの興味と感想が集まることで
新しい発見や、深堀りがもっと楽しく

ユーザー登録

アカウントをお持ちの方はログインページへ

記事へのコメント2件

注目コメント
新着コメント

masadream

masadream よさげ

2023年09月22日リンク

その他

kazuph1986

kazuph1986 これは神記事。whisperさんは長い音声ファイル苦手なので、話者分離≒発話ごとの分離を掛けてからwhisperさんに投げることでwhisperさんの発狂が抑えられている(逆に文脈が切られるので精度は下がるかも)。

2023年03月03日リンク

その他

ゲスト

コメントするにはログインが必要ですログインしてコメント

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

リンクを埋め込む

以下のコードをコピーしてサイトに埋め込むことができます

[<a href="https://b.hatena.ne.jp/entry.parts?url=https%3A%2F%2Fqiita.com%2Fsayo0127%2Fitems%2Fe22fdc229d2dfd879f75">フレーム</a>]

プレビュー

[フレーム]

はてなブックマークボタンを作成して埋め込むこともできます

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック!

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

usersに達しました!

さんが1番目にブックマークした記事「pyannote.audioで...」が注目されています。

気持ちをシェアしよう

ツイートする

pyannote.audioで簡単話者分離〜whisperを添えて〜 - Qiita

音声認識の世界では、OpenAIが開発したwhisperというモデルが話題になりましたね。99言語に対応しており... 音声認識の世界では、OpenAIが開発したwhisperというモデルが話題になりましたね。99言語に対応しており、日本語の音声認識の精度も抜群です。非常に優秀なwhisperですが、いつ誰が話したのかを認識する、いわゆる「話者分離」はできません...。ということで、アドベントカレンダー8日目の記事では、pyannote.audioというライブラリを使った話者分離方法について紹介します。 pyannote.audioの概要 pyannote.audioは、話者分離のためのPythonによるオープンソースフレームワークです。下記のようなパイプラインで話者分離を実現しています。論文:pyannote.audio: neural building blocks for speaker diarization Github:https://github.com/pyannote/pyannote