エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください
Twitterで共有ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
はじめに Parakeet株式会社リサーチャーの榎本 (X: @henomoto1025)です。純粋数学で博士号を取りポスド... はじめに Parakeet株式会社リサーチャーの榎本 (X: @henomoto1025)です。純粋数学で博士号を取りポスドクをしていましたが、音声の分野に興味が移り、現在は音声界隈の研究のキャッチアップをしながら研究開発をしています。 さて、今回は、日本語の音声AIの評価に使われる CER (Character Error Rate, 文字誤り率) について初見で分かるように解説し、また(私自身が知らなかった)複数発話のCERを集約する際の注意事項について説明します。 この記事で伝えたいこと まず最初に、この記事で伝えたいことについて簡単にまとめます。 CERは主に日本語の音声認識の評価に用いられる指標。だが、音声変換や音声合成の評価にも用いられる。 CERは「正しい文字列から比べて、生成結果の文字列がどれだけの割合間違っているか」を表す定量的な指標。編集距離 という概念を用いて定式化す