エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください
Twitterで共有ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
以下、旧モデルからの主要な改善点を整理する。 入出力のコンテキスト 入力コンテキストでは最大272Kト... 以下、旧モデルからの主要な改善点を整理する。 入出力のコンテキスト 入力コンテキストでは最大272Kトークン、推論展開と最終回答に最大128Kトークンの合計40万トークン規模のウィンドウを利用できる。これにより、複数ファイルを含むリポジトリ横断、長大資料の整合性確認や要約、インターネットを利用した検索結果や複数ドキュメントを一括で比較・統合といった長距離依存タスクを単一ラウンドで処理しやすくなった。長コンテキスト性能評価(BrowseComp Long Context、128K〜256K入力)で89%正答を記録し、従来のGPT‐4.1やo3と比較して長文範囲の情報回収・再構成で高い再現性を示している。 事実性 実運用プロンプトでGPT‐4o比で事実誤認を約20%低減。thinkingモードではo3比で約70%低減。長文全体の事実整合性評価(LongFact)や回答内の主張単位ごとの事実一致