[フレーム]
はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

気に入った記事をブックマーク

  • 気に入った記事を保存できます
    保存した記事の一覧は、はてなブックマークで確認・編集ができます
  • 記事を読んだ感想やメモを書き残せます
  • 非公開でブックマークすることもできます
適切な情報に変更

エントリーの編集

loading...

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。

タイトルガイドライン

このページのオーナーなので以下のアクションを実行できます

タイトル、本文などの情報を
再取得することができます
コメントを非表示にできます コメント表示の設定

ブックマークしました

ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください

Twitterで共有

ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します

239users がブックマーク コメント 10

ガイドラインをご確認の上、良識あるコメントにご協力ください

0 / 0
入力したタグを追加

現在プライベートモードです 設定を変更する

おすすめタグタグについて

よく使うタグ

LLM推論に関する技術メモ

239 users iwashi.co

ガイドラインをご確認の上、良識あるコメントにご協力ください

0 / 0
入力したタグを追加

現在プライベートモードです 設定を変更する

おすすめタグタグについて

よく使うタグ

はてなブックマーク

はてなブックマークで
関心をシェアしよう

みんなの興味と感想が集まることで
新しい発見や、深堀りがもっと楽しく

ユーザー登録

アカウントをお持ちの方はログインページ

記事へのコメント10

  • 注目コメント
  • 新着コメント
stealthinu
LLMを商用APIから使うのとollamaでローカルLLMを使うのの間の技術が書かれてる。これは実際に運用すんの凄く大変だとわかる。絶対API叩くほうが現実的...

その他
misshiki
"BentoMLによるLLM Inference Handbookという、LLMの推論をまとめたハンドブックがある。本記事ではハンドブックや他の情報も参照しつつ、自分のメモ用としてLM推論に関する技術をまとめていく。"

その他
strawberryhunter
OllamaとかLM Studioで動かないモデル多すぎ問題。動かすにはPythonを直接使うことになるが、アプリケーションからはAPIで呼び出したいのでPythonでAPIサーバーを書く羽目に。最初からOpenAIとかAnthropic使った方が良いことづくめ。

その他
hirorinya
なるほど、学び

その他
gfx
大変よいまとめだった。セルフホストの困難さが際立つなあ。

その他
FreeCatWork
LLM?また難しいこと言ってるにゃ!ボクと遊んでくれたら賢くなるのににゃ〜!

その他
yarumato
"ローカルLLMを使う(LLMのAPIを利用しない、Open WeightなLLMを利用したい)場合は、LLM推論で抽象化・隠蔽されている技術(token化、推論の2phase、..)を理解すると、最適化できる。応答速度が早くなる。"

その他
stealthinu
stealthinu LLMを商用APIから使うのとollamaでローカルLLMを使うのの間の技術が書かれてる。これは実際に運用すんの凄く大変だとわかる。絶対API叩くほうが現実的...

2025年07月21日 リンク

その他
nukano0522
"これ"

その他
byaa0001
最近LLMに関する知識に飢えてるなぁ、あんまりホッテントリに上がってきてくんないのでありがたい

その他
iwashi86
書きました。

その他

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

リンクを埋め込む

以下のコードをコピーしてサイトに埋め込むことができます

プレビュー
アプリのスクリーンショット
いまの話題をアプリでチェック!
  • バナー広告なし
  • ミュート機能あり
  • ダークモード搭載
アプリをダウンロード

関連記事

usersに達しました!

さんが1番目にブックマークした記事「LLM推論に関する技...」が注目されています。

気持ちをシェアしよう

ツイートする

LLM推論に関する技術メモ

はじめに BentoMLによるLLM Inference Handbookという、LLMの推論をまとめたハンドブックがある。記事... はじめに BentoMLによるLLM Inference Handbookという、LLMの推論をまとめたハンドブックがある。記事ではハンドブックや他の情報も参照しつつ、自分のメモ用としてLM推論に関する技術をまとめていく。 LLMの推論と内部理解の必要性 LLM推論とは、GPT-4、Llama 4、DeepSeek-V3などの学習済みLLMを使用して、ユーザーの入力から意味のある出力を生成することを指している。その推論には、たくさんの技術が抽象化・隠蔽されている。APIを利用している場合は、ほぼ意識せず活用できる。しかし、APIを何らかの理由で利用できない場合や、Open WeightなLLMを利用したい場合はこれらの技術を理解する必要がある。 実際、最適化されていない設定では、GPU時間で10倍のコストがかかることもある。ユーザー面であっても、最適化がされていなければ、応答速度が遅くな

ブックマークしたユーザー

  • sanko04082025年07月26日 sanko0408
  • kimkimfindy2025年07月25日 kimkimfindy
  • yamori04082025年07月24日 yamori0408
  • wkubota2025年07月23日 wkubota
  • ikosin2025年07月23日 ikosin
  • enemyoffreedom2025年07月23日 enemyoffreedom
  • yuiseki2025年07月23日 yuiseki
  • minorusato2025年07月22日 minorusato
  • misshiki2025年07月22日 misshiki
  • strawberryhunter2025年07月22日 strawberryhunter
  • k0yoshitsugu2025年07月22日 k0yoshitsugu
  • midas365452025年07月22日 midas36545
  • wasabinax2025年07月22日 wasabinax
  • motorunder2025年07月22日 motorunder
  • worldwideyrp2025年07月22日 worldwideyrp
  • gmdualis4792025年07月22日 gmdualis479
  • CLSmooth2025年07月22日 CLSmooth
  • hirorinya2025年07月22日 hirorinya
すべてのユーザーの
詳細を表示します

ブックマークしたすべてのユーザー

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

同時期にブックマークされた記事

いま人気の記事 - 企業メディア

企業メディアをもっと読む

はてなブックマーク

公式Twitter

はてなのサービス

Copyright © 2005-2025 Hatena. All Rights Reserved.
設定を変更しましたx

AltStyle によって変換されたページ (->オリジナル) /