エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください
Twitterで共有ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
はじめに 世界的にLLMの導入が進んでいますが、 意外と仕組みは知られていないと感じています。 ですが... はじめに 世界的にLLMの導入が進んでいますが、 意外と仕組みは知られていないと感じています。 ですが、仕組みを知っていれば、 思わぬ失敗を防いだり、よりよい活用ができると考えています。 そこで、この記事を書くことにしました。 O'Reillyの「直感 LLM」で学んだことが中心になります。(良著でした) LLMとは ChatGPTやGeminiの背後にあるものです。 Large Language Modelの略であり、大規模言語モデルと訳されます。 Transf ormerとは ChatGPTやGeminiのLLMのベースになるものです。 この記事では、Transf ormerを通して、LLMの仕組みを書いていきます。 Transf ormerは簡単に言うと、 「テキストを入力すると、それに応じたテキストを出力するもの」です。 トークンとは コンピューターで扱いやすいよう、LLMはテキストをト