エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください
Twitterで共有ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
導入 こんにちは、株式会社ナレッジセンスの須藤英寿です。 今回は、RAGで数値情報を正しく認識できるの... 導入 こんにちは、株式会社ナレッジセンスの須藤英寿です。 今回は、RAGで数値情報を正しく認識できるのかを調査した論文を紹介します。 サマリー RAGはユーザーの質問に対して、意味的な類似度から関連性の高い情報を検索して、ユーザーの質問に回答します。この意味的な類似度の検索がRAGの技術を支えていますが、その性能に関しては様々なベンチマークが乱立しており、体系的に把握されていないことも多く存在します。 今回は、数値にフォーカスして、RAGが正確に数値を把握できているかの調査結果とその分析をしていきます。 課題意識 類似度検索の限界 意味的な類似度による検索は、一見万能に見えますが苦手もあります。一般的には、固有名詞、特に社内用語などの一般には知られていない単語や言葉の使い方が登場すると、類似度検索の性能は大きく下がります。これは、学習の段階で登場しない単語の類似度を判定できないためです。そ