エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください
Twitterで共有ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
実運用の強さ:少トークンでSOTA級に迫る OmniDocBenchで比較するとさ、 Small(100トークン) で既にGO... 実運用の強さ:少トークンでSOTA級に迫る OmniDocBenchで比較するとさ、 Small(100トークン) で既にGOT-OCR2.0(256トークン)を超えがちだし。 Large(400, 有効285トークン) でSOTAと肩並べる感じ。 Gundam(<800トークン)でMinerU2.0(約6790トークン) より優秀。コスパ良すぎでしょ。 カテゴリ別の肌感: スライドは64トークンで十分。 本・レポートは100トークンで良。 新聞はテキスト密度高すぎなのでGundam以上が欲しい。 なんでこんなに軽いの? ×ばつ圧縮+グローバル注意の直列デザインがマジ効いてる。 前段で大量パッチを安く見て、中間でトークンをギュッと圧縮してから、後段でリッチに解釈。 GPUメモリのアクティベーション低め、トークン数少なめ、多解像度対応で、訓練も推論も扱いやすい。 具体的にでき