はてなブックマーク
テクノロジー
採点理由を出力しながらローカルLLMを評価する【Elyza Tasks 100】

気に入った記事をブックマーク

気に入った記事を保存できます
保存した記事の一覧は、はてなブックマークで確認・編集ができます
記事を読んだ感想やメモを書き残せます
非公開でブックマークすることもできます

採点理由を出力しながらローカルLLMを評価する【Elyza Tasks 100】

テクノロジーカテゴリーの変更を依頼記事元:zenn.dev/asap

適切な情報に変更

エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。

このページのオーナーなので以下のアクションを実行できます

タイトル、本文などの情報を
再取得することができます

コメントを非表示にできますコメント表示の設定

ブックマークしました

ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください

Twitterで共有

次回からTwitterへ自動リダイレクト

ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します

4users がブックマークコメント 1

ゲスト

コメントするにはログインが必要ですブックマークを追加

ブックマークを追加

よく使うタグ

採点理由を出力しながらローカルLLMを評価する【Elyza Tasks 100】

4 users zenn.dev/asap

よく使うタグ

はてなブックマーク

はてなブックマークで
関心をシェアしよう

みんなの興味と感想が集まることで
新しい発見や、深堀りがもっと楽しく

ユーザー登録

アカウントをお持ちの方はログインページへ

記事へのコメント1件

注目コメント
新着コメント

yarumato

yarumato "ベンチマークの中には、100問の日本語性能を測るためのあらゆる分野での自然言語タスクの質問文と、その模範回答、また各タスクごとの採点基準が記載されています。 "

2025年02月06日リンク

その他

ゲスト

コメントするにはログインが必要ですログインしてコメント

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

リンクを埋め込む

以下のコードをコピーしてサイトに埋め込むことができます

[<a href="https://b.hatena.ne.jp/entry.parts?url=https%3A%2F%2Fzenn.dev%2Fasap%2Farticles%2F3a99c34fc1d4cb">フレーム</a>]

プレビュー

[フレーム]

はてなブックマークボタンを作成して埋め込むこともできます

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック!

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

usersに達しました!

さんが1番目にブックマークした記事「採点理由を出力し...」が注目されています。

気持ちをシェアしよう

ツイートする

採点理由を出力しながらローカルLLMを評価する【Elyza Tasks 100】

はじめに既存の70BクラスのLLMが日本語でどのくらいの性能なのかを見る必要がありました。本日はLLMを... はじめに既存の70BクラスのLLMが日本語でどのくらいの性能なのかを見る必要がありました。本日はLLMをElyza Tasks 100というベーシックなベンチマークを使って、評価をしたので、忘備録の記事を書きます。 n番煎じではありますが、スコアだけを出すのではなく、ローカルLLMの出力結果や点数の採点理由などをLangChainのLCELを利用して出力しています。そういった情報もベンチマークを実行した際に取得したいなどあれば、少しは参考になるかなと思います。特に、今回、ローカルLLMもクローズドLLMも両方使いたいので、共通した形式で利用できるLangChain(LCEL)を利用しました。その中で、chat_templateというものでつまづきました。同じようにつまづいている人の参考になれば非常に嬉しいです。なお、今回は一番簡単にElyza Tasks 100を選んでいます

ブックマークしたユーザー

yug12242025年02月13日 yug1224
yarumato2025年02月06日 yarumato

すべてのユーザーの
詳細を表示します

同時期にブックマークされた記事

いま人気の記事 - 企業メディア

企業メディアをもっと読む

気に入った記事をブックマーク

エントリーの編集

タイトルガイドライン

ブックマークしました

おすすめタグタグについて

よく使うタグすべて表示

採点理由を出力しながらローカルLLMを評価する【Elyza Tasks 100】

おすすめタグタグについて

よく使うタグすべて表示

はてなブックマークで関心をシェアしよう

記事へのコメント1件

リンクを埋め込む

プレビュー

関連記事

usersに達しました!

採点理由を出力しながらローカルLLMを評価する【Elyza Tasks 100】

ブックマークしたユーザー

ブックマークしたすべてのユーザー

同時期にブックマークされた記事

公式Twitter

はてなのサービス

よく使うタグ

よく使うタグ

はてなブックマークで
関心をシェアしよう