エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください
Twitterで共有ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
サンプル数が少なすぎる雑プロット: F1値だとGemini 1.5 Pro 002とDocument AIが同率一位 GPT-4oは特にR... サンプル数が少なすぎる雑プロット: F1値だとGemini 1.5 Pro 002とDocument AIが同率一位 GPT-4oは特にRecallの低さが顕著で取りこぼしが多い タスク別に見ていくと文字埋め込みのないPDFやスキャンされたデータのようなきれいなテキスト抽出はLMMのほうが優秀 (1) 横書きの活字抽出はどれも同程度 (2, 5) 縦書きの活字抽出はGPT-4oが異様に低くなる (3) 横書きの手書き文字抽出はDocument AIが優秀, LMMは取りこぼしが多くなる (4) 視覚的文書からの情報抽出処理の流れについて 次に、認識ミスを考える前にどうやって画像からの情報抽出を行うかを明らかにします。 この情報抽出においては、単純に画像からテキスト抽出しているだけではなく、情報抽出タスク(構造化データの抽出)も絡んできます。 わかりやすい事例 以前、こちらの記事では、レシー