はてなブックマーク
テクノロジー
MLflow LLM Evaluate:Amazon Bedrock / Claude 3.5 Sonnet で LLM-as-a-Judge による LLM の評価 - Qiita

気に入った記事をブックマーク

気に入った記事を保存できます
保存した記事の一覧は、はてなブックマークで確認・編集ができます
記事を読んだ感想やメモを書き残せます
非公開でブックマークすることもできます

MLflow LLM Evaluate:Amazon Bedrock / Claude 3.5 Sonnet で LLM-as-a-Judge による LLM の評価 - Qiita

テクノロジーカテゴリーの変更を依頼記事元:qiita.com/nttd-saitouyun

適切な情報に変更

エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。

このページのオーナーなので以下のアクションを実行できます

タイトル、本文などの情報を
再取得することができます

コメントを非表示にできますコメント表示の設定

ブックマークしました

ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください

Twitterで共有

次回からTwitterへ自動リダイレクト

ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します

1user がブックマークコメント 0

ゲスト

コメントするにはログインが必要ですブックマークを追加

ブックマークを追加

よく使うタグ

MLflow LLM Evaluate:Amazon Bedrock / Claude 3.5 Sonnet で LLM-as-a-Judge による LLM の評価 - Qiita

1 user qiita.com/nttd-saitouyun

よく使うタグ

はてなブックマーク

はてなブックマークで
関心をシェアしよう

みんなの興味と感想が集まることで
新しい発見や、深堀りがもっと楽しく

ユーザー登録

アカウントをお持ちの方はログインページへ

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

ゲスト

コメントするにはログインが必要ですログインしてコメント

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

リンクを埋め込む

以下のコードをコピーしてサイトに埋め込むことができます

[<a href="https://b.hatena.ne.jp/entry.parts?url=https%3A%2F%2Fqiita.com%2Fnttd-saitouyun%2Fitems%2F061548eabe37a868c507">フレーム</a>]

プレビュー

[フレーム]

はてなブックマークボタンを作成して埋め込むこともできます

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック!

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

usersに達しました!

さんが1番目にブックマークした記事「MLflow LLM Evalua...」が注目されています。

気持ちをシェアしよう

ツイートする

MLflow LLM Evaluate:Amazon Bedrock / Claude 3.5 Sonnet で LLM-as-a-Judge による LLM の評価 - Qiita

はじめに株式会社NTTデータデジタルサクセスソリューション事業部で AWS や Databricks を推進してい... はじめに株式会社NTTデータデジタルサクセスソリューション事業部で AWS や Databricks を推進している nttd-saitouyun です。 MLflow LLM Evaluate でモデルサービングされた LLM を評価する記事を書きました。今回は同じシナリオで、LLM-as-a-Judge による評価をしてみます。マニュアルには OpenAI の GPT を使った評価が多いのですが、今回は、AWS で Databricks を使っている方に役立つようにモデルサービングエンドポイントで接続している Amazon Bedrock / Claude 3.5 Sonnet を使って評価を行います。 MLflow LLM Evaluate LLM の評価は正解を定義することが難しいなど従来と違った難しさがありますが、MLflow LLM Evaluate は、LLM

ブックマークしたユーザー

すべてのユーザーの
詳細を表示します

同時期にブックマークされた記事

米モデルナ、21年のワクチン売上高予想引き下げ株価16%安

1 user jp.reuters.com

いま人気の記事 - 企業メディア

企業メディアをもっと読む

気に入った記事をブックマーク

エントリーの編集

タイトルガイドライン

ブックマークしました

おすすめタグタグについて

よく使うタグすべて表示

MLflow LLM Evaluate:Amazon Bedrock / Claude 3.5 Sonnet で LLM-as-a-Judge による LLM の評価 - Qiita

おすすめタグタグについて

よく使うタグすべて表示

はてなブックマークで関心をシェアしよう

記事へのコメント0件

リンクを埋め込む

プレビュー

関連記事

usersに達しました!

MLflow LLM Evaluate:Amazon Bedrock / Claude 3.5 Sonnet で LLM-as-a-Judge による LLM の評価 - Qiita

ブックマークしたユーザー

ブックマークしたすべてのユーザー

同時期にブックマークされた記事

公式Twitter

はてなのサービス

よく使うタグ

よく使うタグ

はてなブックマークで
関心をシェアしよう