[フレーム]

サクサク読めて、
アプリ限定の機能も多数!

はてなブックマーク
テクノロジー
LLM推論に関する技術メモ

気に入った記事をブックマーク

気に入った記事を保存できます
保存した記事の一覧は、はてなブックマークで確認・編集ができます
記事を読んだ感想やメモを書き残せます
非公開でブックマークすることもできます

LLM推論に関する技術メモ

テクノロジーカテゴリーの変更を依頼記事元:iwashi.co

適切な情報に変更

エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。

このページのオーナーなので以下のアクションを実行できます

タイトル、本文などの情報を
再取得することができます

コメントを非表示にできますコメント表示の設定

ブックマークしました

ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください

Twitterで共有

次回からTwitterへ自動リダイレクト

ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します

239users がブックマークコメント 10

ゲスト

コメントするにはログインが必要ですブックマークを追加

ブックマークを追加

よく使うタグ

LLM推論に関する技術メモ

239 users iwashi.co

よく使うタグ

はてなブックマーク

はてなブックマークで
関心をシェアしよう

みんなの興味と感想が集まることで
新しい発見や、深堀りがもっと楽しく

ユーザー登録

アカウントをお持ちの方はログインページへ

記事へのコメント10件

注目コメント
新着コメント

stealthinu

stealthinu LLMを商用APIから使うのとollamaでローカルLLMを使うのの間の技術が書かれてる。これは実際に運用すんの凄く大変だとわかる。絶対API叩くほうが現実的...

2025年07月21日リンク

その他

misshiki

misshiki "BentoMLによるLLM Inference Handbookという、LLMの推論をまとめたハンドブックがある。本記事ではハンドブックや他の情報も参照しつつ、自分のメモ用としてLM推論に関する技術をまとめていく。"

自然言語処理

2025年07月22日リンク

その他

strawberryhunter

strawberryhunter OllamaとかLM Studioで動かないモデル多すぎ問題。動かすにはPythonを直接使うことになるが、アプリケーションからはAPIで呼び出したいのでPythonでAPIサーバーを書く羽目に。最初からOpenAIとかAnthropic使った方が良いことづくめ。

未分類

2025年07月22日リンク

その他

hirorinya

hirorinya なるほど、学び

2025年07月22日リンク

その他

gfx

gfx 大変よいまとめだった。セルフホストの困難さが際立つなあ。

2025年07月22日リンク

その他

FreeCatWork

FreeCatWork LLM?また難しいこと言ってるにゃ!ボクと遊んでくれたら賢くなるのににゃ〜!

2025年07月21日リンク

その他

yarumato

yarumato "ローカルLLMを使う(LLMのAPIを利用しない、Open WeightなLLMを利用したい)場合は、LLM推論で抽象化・隠蔽されている技術(token化、推論の2phase、..)を理解すると、最適化できる。応答速度が早くなる。"

2025年07月21日リンク

その他

stealthinu

2025年07月21日リンク

その他

nukano0522

nukano0522 "これ"

2025年07月21日リンク

その他

byaa0001

byaa0001 最近LLMに関する知識に飢えてるなぁ、あんまりホッテントリに上がってきてくんないのでありがたい

2025年07月21日リンク

その他

iwashi86

iwashi86 書きました。

LLM
推論

2025年07月21日リンク

その他

ゲスト

コメントするにはログインが必要ですログインしてコメント

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

リンクを埋め込む

以下のコードをコピーしてサイトに埋め込むことができます

[<a href="https://b.hatena.ne.jp/entry.parts?url=https%3A%2F%2Fiwashi.co%2F2025%2F07%2F20%2Fllm-inference">フレーム</a>]

プレビュー

[フレーム]

はてなブックマークボタンを作成して埋め込むこともできます

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック!

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

usersに達しました!

さんが1番目にブックマークした記事「LLM推論に関する技...」が注目されています。

気持ちをシェアしよう

ツイートする

LLM推論に関する技術メモ

はじめに BentoMLによるLLM Inference Handbookという、LLMの推論をまとめたハンドブックがある。本記事... はじめに BentoMLによるLLM Inference Handbookという、LLMの推論をまとめたハンドブックがある。本記事ではハンドブックや他の情報も参照しつつ、自分のメモ用としてLM推論に関する技術をまとめていく。 LLMの推論と内部理解の必要性 LLM推論とは、GPT-4、Llama 4、DeepSeek-V3などの学習済みLLMを使用して、ユーザーの入力から意味のある出力を生成することを指している。その推論には、たくさんの技術が抽象化・隠蔽されている。APIを利用している場合は、ほぼ意識せず活用できる。しかし、APIを何らかの理由で利用できない場合や、Open WeightなLLMを利用したい場合はこれらの技術を理解する必要がある。実際、最適化されていない設定では、GPU時間で10倍のコストがかかることもある。ユーザー面であっても、最適化がされていなければ、応答速度が遅くな

ブックマークしたユーザー

sanko04082025年07月26日 sanko0408
kimkimfindy2025年07月25日 kimkimfindy
yamori04082025年07月24日 yamori0408
wkubota2025年07月23日 wkubota
ikosin2025年07月23日 ikosin
enemyoffreedom2025年07月23日 enemyoffreedom
yuiseki2025年07月23日 yuiseki
minorusato2025年07月22日 minorusato
misshiki2025年07月22日 misshiki
strawberryhunter2025年07月22日 strawberryhunter
k0yoshitsugu2025年07月22日 k0yoshitsugu
midas365452025年07月22日 midas36545
wasabinax2025年07月22日 wasabinax
motorunder2025年07月22日 motorunder
worldwideyrp2025年07月22日 worldwideyrp
gmdualis4792025年07月22日 gmdualis479
CLSmooth2025年07月22日 CLSmooth
hirorinya2025年07月22日 hirorinya

気に入った記事をブックマーク

エントリーの編集

タイトルガイドライン

ブックマークしました

おすすめタグタグについて

よく使うタグすべて表示

LLM推論に関する技術メモ

おすすめタグタグについて

よく使うタグすべて表示

はてなブックマークで関心をシェアしよう

記事へのコメント10件

リンクを埋め込む

プレビュー

関連記事

usersに達しました!

LLM推論に関する技術メモ

ブックマークしたユーザー

ブックマークしたすべてのユーザー

同時期にブックマークされた記事

公式Twitter

はてなのサービス

よく使うタグ

よく使うタグ

はてなブックマークで
関心をシェアしよう