エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください
Twitterで共有ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
Oct 14, 2024Custom LLM as a Judge to Detect Hallucinations with Braintrust Let's say you're worki... Oct 14, 2024Custom LLM as a Judge to Detect Hallucinations with Braintrust Let's say you're working on a customer service bot and trying to evaluate the quality of its responses. Consider a question like "What is your return policy?" If the correct answer is "You can return it ems within 30 days of purchase," but your bot generates "You can return it ems within 30 days," how would you evaluate wheth