[フレーム]
はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

気に入った記事をブックマーク

  • 気に入った記事を保存できます
    保存した記事の一覧は、はてなブックマークで確認・編集ができます
  • 記事を読んだ感想やメモを書き残せます
  • 非公開でブックマークすることもできます
適切な情報に変更

エントリーの編集

loading...

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。

タイトルガイドライン

このページのオーナーなので以下のアクションを実行できます

タイトル、本文などの情報を
再取得することができます
コメントを非表示にできます コメント表示の設定

ブックマークしました

ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください

Twitterで共有

ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します

1449users がブックマーク コメント 74

ガイドラインをご確認の上、良識あるコメントにご協力ください

0 / 0
入力したタグを追加

現在プライベートモードです 設定を変更する

おすすめタグタグについて

よく使うタグ

日本語に特化したOCR、文書画像解析Pythonパッケージ「YomiToku」を公開しました|Kotaro.Kinoshita

ガイドラインをご確認の上、良識あるコメントにご協力ください

0 / 0
入力したタグを追加

現在プライベートモードです 設定を変更する

おすすめタグタグについて

よく使うタグ

はてなブックマーク

はてなブックマークで
関心をシェアしよう

みんなの興味と感想が集まることで
新しい発見や、深堀りがもっと楽しく

ユーザー登録

アカウントをお持ちの方はログインページ

記事へのコメント74

  • 注目コメント
  • 新着コメント
ublftbo
たいへん興味深い。使ってみよう。/ 使ってみた。自分の使う(ごちゃごちゃして厄介な)文書対象だと、他のOCRより圧倒的に優秀。すごい。

その他
ydf
レイアウト解析、表解析、読み順推定がスゴイかも。OCRは活字対応で手書きは非対応と思われる。

その他
bonita_bonita
視覚障害者やそのサポート事業者にとっては朗報なのでは

その他
CffnAddict
tesseractとかOCRめんどくさいイメージしかないんだよな〜って一応見てみたら、ただの神が神ツールを公開したという話だった

その他
asakatana
ローカルで動くのはいいな

その他
ihirokyx
ドキュメント解析結果の連携 PDFなどの表のデータからのデータの転記作業の効率化 その他、文書画像からの情報抽出を伴う、作業の半自動化 機密情報が記載された文書画像のローカルサーバー内での解析

その他
hunglysheep1
表の構造をHTMLで再現するの凄いな

その他
yuumillar
kindle本のocr→テキスト化に使ってみたい

その他
xjack
PyTorchとOpenCVを使ってるのね.Hugging Faceからウェイトファイルが自動ダウンロードされる感じ.

その他
hevohevo
ローカルで動く&個人用途無料は大きいな。視覚・聴覚障害者向けの支援にも使えそう。ありがたや。

その他
slack_pulse
cliで使えるのがいいな。goのラッパーでも作って使ってみよう

その他
tmatsuu
AIを使ったOCR。「インターネット上で公開されている文書データや合成データを生成し、学習に利用」ほほう

その他
ite
良さそう

その他
myr
すごいというか「へー。。。」を連発しながら読んでた。。色々なものが並行して進化するなぁ

その他
nekotank
日本語特化OCR、すばらしい!個人の検証利用は無料。商用は別途ライセンス必要

その他
IGA-OS
日本語OCR良いな。良い評価が上がっている様子

その他
rizenback000
ついにきたか。使ってみよ。

その他
stabucky
実際に第三者で試した人いないの?

その他
otihateten3510
何者だよ

その他
chago
えー、みてみよ

その他
gmym
作者のTwitterアカウント見に行ったけど開発開始が10月上旬...?マジで?

その他
cpw
これはすごい。使ってみよう。試してみた。エグい。表も起こしてくれるし、画像もちゃんと切り取ってくれる。すごすぎる

その他
kazuhix
×ばつ選拳しろまる選挙の誤変換を直せるツールがついにできた...のか?

その他
naoto_moroboshi
神やんけ、マジで

その他
Galaxy42
ほほう

その他
shimasoba
透明テキスト付きのPDFに変換できないかなぁ。

その他
phyten_obr
凄すぎる

その他
Mabuo_H
これ例見てるだけでもかなりすごそうだな。。。

その他
moonzkk101
精度の高い文書画像解析は、視覚障害があって音声読み上げを利用している人にも必要な技術。期待したい。

その他
andvert
中華の鉄人かと思いました

その他
bayaread
LLM全盛期のいま、こういう地道な方向で研究活動されてるのには本当に頭が下がる思いだ。すばらしい活動をありがとうございます!

その他
OkadaHiroshi
Google Colab Pro (T4 GPU) で十分動作しました。

その他
hiroomi
何と連携させるかの整備もしておくとよい感じかな。と、今思った。

その他
cartman0
google lensより高性能なんだろうか

その他
call_me_nots
次に残念な表を見たら使ってみる!

その他
circled
日本語、縦書きと横書きが混ざるから辛いんだよね。なお、少し昔の文(江戸、明治)になると横書きも右から左に書き出す場合が発生し出すから死ぬ。古い資料とか辛い

その他
kusomamma
うーん、結局はCUDAでGPUに働いてもらう必要があるとなると、無理にローカルで使えるを目指す必要なくね?と思ってしまう。

その他
fashi
どこかの誰かがちまちま精度上げる研究してるだろう分野をLLMが革新していく様を眺めている

その他
misshiki
"YomiTokuはPDFやカメラで撮影された文書画像を解析するためのPythonパッケージです。"

その他
yoshi-na
構造解析とその出力(しかも複数方法)まで備えててエグい

その他

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

リンクを埋め込む

以下のコードをコピーしてサイトに埋め込むことができます

プレビュー
アプリのスクリーンショット
いまの話題をアプリでチェック!
  • バナー広告なし
  • ミュート機能あり
  • ダークモード搭載
アプリをダウンロード

関連記事

usersに達しました!

さんが1番目にブックマークした記事「日本語に特化したO...」が注目されています。

気持ちをシェアしよう

ツイートする

日本語に特化したOCR、文書画像解析Pythonパッケージ「YomiToku」を公開しました|Kotaro.Kinoshita

はじめに最近、LLMへのRAGを用いた文書データの連携等を目的に海外を中心にOCRや文書画像解析技術に関連... はじめに最近、LLMへのRAGを用いた文書データの連携等を目的に海外を中心にOCRや文書画像解析技術に関連する新しいサービスが活発にリリースされています。 しかし、その多くは日語をメインターゲットに開発されているわけではありません。日語文書は、英数字に加えて、ひらがな、漢字、記号など数千種類の文字を識別する必要があったり、縦書きなど日語ドキュメント特有のレイアウトに対処する必要があったりと日語特有の難しさがあります。 ですが、今後、海外の開発者がこれらの課題に対処するため、日のドキュメント画像解析に特化したものをリリースする可能性は低く、やはり自国の言語向けのサービスは自国のエンジニアが開発すべきだと筆者は考えています。 もちろん、Azure Document Intelligenceをはじめとした、クラウドサービスのドキュメント解析サービスはありますが、クラウドを利用できないユ

ブックマークしたユーザー

  • beeworks2025年08月23日 beeworks
  • lunar-rear2025年06月21日 lunar-rear
  • gungen2025年04月26日 gungen
  • nullpobug2025年04月07日 nullpobug
  • gkdjgmcnvirgj2025年03月30日 gkdjgmcnvirgj
  • slack_pulse2025年03月21日 slack_pulse
  • kuroshironeko4792025年03月07日 kuroshironeko479
  • BOSEIsan2025年02月27日 BOSEIsan
  • hoge2411072025年02月22日 hoge241107
  • NATTOMAKI2025年01月28日 NATTOMAKI
  • sota3442025年01月22日 sota344
  • knzw252024年12月31日 knzw25
  • lugecy2024年12月31日 lugecy
  • techtech05212024年12月30日 techtech0521
  • pipidayooo2024年12月28日 pipidayooo
  • fumirin52024年12月28日 fumirin5
  • heatman2024年12月28日 heatman
  • tok_hima2024年12月24日 tok_hima
すべてのユーザーの
詳細を表示します

ブックマークしたすべてのユーザー

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

同時期にブックマークされた記事

いま人気の記事 - 企業メディア

企業メディアをもっと読む

はてなブックマーク

公式Twitter

はてなのサービス

Copyright © 2005-2025 Hatena. All Rights Reserved.
設定を変更しましたx

AltStyle によって変換されたページ (->オリジナル) /