エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください
Twitterで共有ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
こんにちは!逆瀬川 ( https://x.com/gyakuse ) です! このアドベントカレンダーでは生成AIのアプリケ... こんにちは!逆瀬川 ( https://x.com/gyakuse ) です! このアドベントカレンダーでは生成AIのアプリケーションを実際に作り、どのように作ればいいのか、ということをわかりやすく書いていければと思います。アプリケーションだけではなく、プロダクト開発に必要なモデルの調査方法、training方法、基礎知識等にも触れていければと思います。 0. 今回の記事について 今日は言語モデルの推論部分について軽くお話します。 それではやっていきましょう 1. そもそも: LLMってどうやって動いてる? ハルシネーションについて考える前に、ぱぱっとLLMの挙動について思い出していきましょう。 LLMは膨大なテキストデータを使ってトレーニングされ、「次に来るであろうトークン (サブワード単位の単語)」を予測する仕組みになっています。ChatGPTやLlamaなどのモデルは、Transfo