[フレーム]

サクサク読めて、
アプリ限定の機能も多数!

はてなブックマーク
テクノロジー
バッチ化対応APIサーバで rinna 3.6b のスループットを実測する

気に入った記事をブックマーク

気に入った記事を保存できます
保存した記事の一覧は、はてなブックマークで確認・編集ができます
記事を読んだ感想やメモを書き残せます
非公開でブックマークすることもできます

バッチ化対応APIサーバで rinna 3.6b のスループットを実測する

テクノロジーカテゴリーの変更を依頼記事元:zenn.dev/rinna

適切な情報に変更

エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。

このページのオーナーなので以下のアクションを実行できます

タイトル、本文などの情報を
再取得することができます

コメントを非表示にできますコメント表示の設定

ブックマークしました

ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください

Twitterで共有

次回からTwitterへ自動リダイレクト

ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します

1user がブックマークコメント 0

ゲスト

コメントするにはログインが必要ですブックマークを追加

ブックマークを追加

よく使うタグ

バッチ化対応APIサーバで rinna 3.6b のスループットを実測する

1 user zenn.dev/rinna

よく使うタグ

はてなブックマーク

はてなブックマークで
関心をシェアしよう

みんなの興味と感想が集まることで
新しい発見や、深堀りがもっと楽しく

ユーザー登録

アカウントをお持ちの方はログインページへ

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

ゲスト

コメントするにはログインが必要ですログインしてコメント

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

リンクを埋め込む

以下のコードをコピーしてサイトに埋め込むことができます

[<a href="https://b.hatena.ne.jp/entry.parts?url=https%3A%2F%2Fzenn.dev%2Frinna%2Farticles%2F31486789a4886e">フレーム</a>]

プレビュー

[フレーム]

はてなブックマークボタンを作成して埋め込むこともできます

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック!

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

usersに達しました!

さんが1番目にブックマークした記事「バッチ化対応APIサ...」が注目されています。

気持ちをシェアしよう

ツイートする

バッチ化対応APIサーバで rinna 3.6b のスループットを実測する

はじめに前回の記事ではテキスト生成APIサーバのスループットを高めるbatching algorithmsについて紹介... はじめに前回の記事ではテキスト生成APIサーバのスループットを高めるbatching algorithmsについて紹介しました。今回は実際にAPIサーバに対して負荷テストを実施することで処理能力を実測します。dynamic batchingが可能なFasterTransf ormer+Triton Inference Serverとcontinuous batchingが可能なvLLMを比較します。モデルはHugging Faceで公開されているrinna/japanese-gpt-neox-3.6b-instruction-ppoを利用します。 APIサーバのセットアップ FasterTransf ormer+Triton Inference Server Triton Inference Serverがプリインストールされているdocker imageを利用します。dockerをインスト

気に入った記事をブックマーク

エントリーの編集

タイトルガイドライン

ブックマークしました

おすすめタグタグについて

よく使うタグすべて表示

バッチ化対応APIサーバで rinna 3.6b のスループットを実測する

おすすめタグタグについて

よく使うタグすべて表示

はてなブックマークで関心をシェアしよう

記事へのコメント0件

リンクを埋め込む

プレビュー

関連記事

usersに達しました!

バッチ化対応APIサーバで rinna 3.6b のスループットを実測する

ブックマークしたユーザー

ブックマークしたすべてのユーザー

同時期にブックマークされた記事

公式Twitter

はてなのサービス

よく使うタグ

よく使うタグ

はてなブックマークで
関心をシェアしよう