エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください
Twitterで共有ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
フィードバックループのスケーリングとは?これはオリジナルの概念なので補足する。 フィードバックルー... フィードバックループのスケーリングとは?これはオリジナルの概念なので補足する。 フィードバックループのスケーリングとは、1タスクの遂行において「状況を確認し意見を修正する機会数」をスケーリングさせるという概念。 推論スケーリング では、1回のタスクのために、長時間や超ステップで考えさせる。 フィードバックループのスケーリング では、1回のタスクに対して「意見修正」できる機会をたくさん作る。 わかりやすいモデルケースなぜフィードバックループのスケーリングが重要なのか?このコンセプトを明確にするために、単純化したモデルを考えてみよう。 以下の2つのモデルのうち、どちらが自動運転で高い性能を発揮するか? 「超AIが考え抜いて、朝イチバンに明日の株価を予測する」 「並のAIが、1時間ごとに状況判断を修正しつつ明日の株価を予測する」 実際に運用した場合、どう考えても後者のほうが良い成績を残すだろう。