[フレーム]

サクサク読めて、
アプリ限定の機能も多数!

はてなブックマーク
テクノロジー
国立国会図書館のOCRライブラリが凄くよかった件(Windows向け) - Qiita

気に入った記事をブックマーク

気に入った記事を保存できます
保存した記事の一覧は、はてなブックマークで確認・編集ができます
記事を読んだ感想やメモを書き残せます
非公開でブックマークすることもできます

国立国会図書館のOCRライブラリが凄くよかった件(Windows向け) - Qiita

テクノロジーカテゴリーの変更を依頼記事元:qiita.com/yanosen_jp

適切な情報に変更

エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。

このページのオーナーなので以下のアクションを実行できます

タイトル、本文などの情報を
再取得することができます

コメントを非表示にできますコメント表示の設定

ブックマークしました

ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください

Twitterで共有

次回からTwitterへ自動リダイレクト

ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します

543users がブックマークコメント 31

ゲスト

コメントするにはログインが必要ですブックマークを追加

ブックマークを追加

よく使うタグ

国立国会図書館のOCRライブラリが凄くよかった件(Windows向け) - Qiita

543 users qiita.com/yanosen_jp

よく使うタグ

はてなブックマーク

はてなブックマークで
関心をシェアしよう

みんなの興味と感想が集まることで
新しい発見や、深堀りがもっと楽しく

ユーザー登録

アカウントをお持ちの方はログインページへ

記事へのコメント31件

注目コメント
新着コメント

circled

circled ちなみに普通の縦書き日本語のOCRだと、何故かiOSアプリの一太郎Padがちょっと意味不明に強い https://apps.apple.com/jp/app/%E4%B8%80%E5%A4%AA%E9%83%8Epad/id1490522571

2025年03月26日リンク

その他

l_etranger

l_etranger へー。国会図書館がGitHubにOCRのプログラムコードをあげているの、知らなかった。旧字体や縦書きにも強い、と。今度、和古書で試してみよう。

2025年03月26日リンク

その他

k-takahashi

k-takahashi "国立国会図書館が公開しているOCRライブラリ、NDLOCR" "現在ver2.1がGithubに公開" "古い本が多い国会図書館の資料向けに作られているだけあって、旧字体でも高い精度で認識"

技術

2025年03月26日リンク

その他

Rouble

Rouble デジタルコレクションの全文検索すごいもんなあ。

2025年03月27日リンク

その他

kyukyunyorituryo

kyukyunyorituryo bunkoOCRがオススメされてたな。 https://99nyorituryo.hatenablog.com/entry/2023/09/24/020328

2025年03月26日リンク

その他

uchiten

uchiten そっちの「ライブラリ」か。図書館のライブラリって「力こそパワー」っぽさがあるのに完全に正しい使い方だった。

2025年03月27日リンク

その他

Imamu

Imamu 「日本語OCR, 有料の業務用ソフトには色々と高性能なものがあるんですが、無料の場合の選択肢は意外に限られてます」「国立国会図書館が公開しているOCRライブラリ、NDLOCR」一太郎PadやbunkoOCRもきになる

図書館

2025年03月27日リンク

その他

roshi

roshi これは便利そう。

2025年03月26日リンク

その他

ya--mada

ya--mada Githubサイトにある通り、NVIDIA Driverが、Linuxの場合: 450.36.06以上、Windowsの場合:520.06以上である必要があります。Macでは動かないです。私はWindowsをつかってますので、以下はWindowsだけの情報になります。

あとで読む

2025年04月01日リンク

その他

tmatsuu

tmatsuu GitHubに公開されてるのすばらしい。

2025年03月30日リンク

その他

misshiki

misshiki "国立国会図書館が公開しているOCRライブラリ、NDLOCR...このライブラリを試してみました。基本、Githubサイトに書いてある通りなんですが、いくつか注意すべき点をメモ"

2025年03月27日リンク

その他

raitu

raitu "NDLOCRは、現在ver2.1がGithubに公開されています。古い本が多い国会図書館の資料向けに作られているだけあって、旧字体でも高い精度で認識してくれます"

2025年03月27日リンク

その他

ka-ka_xyz

ka-ka_xyz ScanSnapのデフォルトOCRであんま不自由してない(pdftotextでOCR透明テキストを抜いてローカルのelasticsearchに突っ込んで全文検索してる)けど、どうなのかなこれ。

2025年03月27日リンク

その他

yarumato

yarumato "無料OCRはGeminiは縦書きに弱い。Github公開の国立国会図書館OCRライブラリは旧字体でも高い精度で認識。NVIDIAのグラボ必要。Dockerコンテナの起動。VSCodeのDocker拡張機能を使うと、作業がかなり楽に"

2025年03月27日リンク

その他

prograti

prograti 今はどうか分からないけど一太郎PadのOCRエンジンはGoogle Cloud Visionを使っているらしい https://internet.watch.impress.co.jp/docs/news/1222537.html

2025年03月27日リンク

その他

kaorun

kaorun その点Copilotのphi3、今の所縦書きとか手書きの日本語にめっちゃ弱いのが残念なんだよなぁ。Windows Recallで板書がうまく拾って貰えないんよ

2025年03月27日リンク

その他

uchiten

uchiten そっちの「ライブラリ」か。図書館のライブラリって「力こそパワー」っぽさがあるのに完全に正しい使い方だった。

2025年03月27日リンク

その他

Galaxy42

Galaxy42 後で試す

これはきになる

2025年03月27日リンク

その他

softantenna

softantenna 国立国会図書館が提供するOCRライブラリ「NDLOCR」をWindows環境で使用する方法についての解説。古い書籍や旧字体に対しても高い認識精度を持っているらしい。

2025年03月27日リンク

その他

kwbtsts

kwbtsts 廃刊になった地元紙のアーカイブを画像で持っているので試してみたい

2025年03月27日リンク

その他

at_yasu

at_yasu yomitoku とは別?へー。

2025年03月27日リンク

その他

ardarim

ardarim 試してみたいけどそこそこのスペックのマシンがない...。性能がいいのか分からんけど取り敢えずGUIフロントエンドがないと普及はしなさそうではある

画像認識

2025年03月27日リンク

その他

stabucky

stabucky 「猿飛佐助」のOCRにチャレンジしたことがあるが全くダメだった。とうとうできるようになったか。

2025年03月27日リンク

その他

Imamu

図書館

2025年03月27日リンク

その他

tekitou-manga

tekitou-manga おれも「そこそこ」のマシンが欲しいなと思いました

2025年03月27日リンク

その他

Anonymous2000

Anonymous2000 日本の近代以前の文字は全く読めないのだけど、史学科の友達に教えてあげよう。

2025年03月27日リンク

その他

ryudenx

ryudenx すごい、これは自分でもダブルチェックしてみる

あとで読む

2025年03月27日リンク

その他

Rouble

Rouble デジタルコレクションの全文検索すごいもんなあ。

2025年03月27日リンク

その他

kagehiens

kagehiens お、これは税金を使う意味がある機能と開発成果公開

2025年03月26日リンク

その他

filinion

filinion 国会図書館の話なのに「ライブラリ」が図書館の意味でなく混乱したのだが、ブコメを見る限り他の人はすんなり読めたらしい。さすがはてな。

2025年03月26日リンク

その他

kyukyunyorituryo

kyukyunyorituryo bunkoOCRがオススメされてたな。 https://99nyorituryo.hatenablog.com/entry/2023/09/24/020328

2025年03月26日リンク

その他

FreeCatWork

FreeCatWork OCR?すごい技術にゃ!ボク、字が読めないから助かるにゃ!

2025年03月26日リンク

その他

jintrick

jintrick yomitokuとの比較記事待機案件

2025年03月26日リンク

その他

circled

2025年03月26日リンク

その他

l_etranger

2025年03月26日リンク

その他

roshi

roshi これは便利そう。

2025年03月26日リンク

その他

k-takahashi

技術

2025年03月26日リンク

その他

itotto

itotto へー、知らなかった

2025年03月26日リンク

その他

ゲスト

コメントするにはログインが必要ですログインしてコメント

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

リンクを埋め込む

以下のコードをコピーしてサイトに埋め込むことができます

[<a href="https://b.hatena.ne.jp/entry.parts?url=https%3A%2F%2Fqiita.com%2Fyanosen_jp%2Fitems%2F9d3852c29c80dbb952f2">フレーム</a>]

プレビュー

[フレーム]

はてなブックマークボタンを作成して埋め込むこともできます

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック!

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

usersに達しました!

さんが1番目にブックマークした記事「国立国会図書館のO...」が注目されています。

気持ちをシェアしよう

ツイートする

国立国会図書館のOCRライブラリが凄くよかった件(Windows向け) - Qiita

はじめに日本語OCR, 有料の業務用ソフトには色々と高性能なものがあるんですが、無料の場合の選択肢は... はじめに日本語OCR, 有料の業務用ソフトには色々と高性能なものがあるんですが、無料の場合の選択肢は意外に限られてます。最近ではGeminiなどにOCRさせることも試みてますが、縦書きに弱いのが欠点。加えて、私がやっているような著作権が切れた戦前の本のデジタル化の場合、認識率の低い旧字体が多いのが悩みの種。そこで最近知ったのが、国立国会図書館が公開しているOCRライブラリ、NDLOCRです。国会図書館のデジタル資料(国立国会図書館デジタルコレクション)から全文テキストデータを作成するために開発されたとのこと。 NDLOCRは、現在ver2.1がGithubに公開されています。古い本が多い国会図書館の資料向けに作られているだけあって、旧字体でも高い精度で認識してくれます。今回は、このライブラリを試してみました。基本、Githubサイトに書いてある通りなんですが、いくつか注意すべき点をメモ

ブックマークしたユーザー

techtech05212025年08月03日 techtech0521
heatman2025年04月25日 heatman
norisuke32025年04月24日 norisuke3
l-_-ll2025年04月23日 l-_-ll
yug12242025年04月17日 yug1224
yo_waka2025年04月12日 yo_waka
gogatsu262025年04月12日 gogatsu26
nvr3ycbp2025年04月07日 nvr3ycbp
lugecy2025年04月06日 lugecy
miguchi2025年04月06日 miguchi
T-miura2025年04月05日 T-miura
darupants2025年04月02日 darupants
igrep2025年04月02日 igrep
satoshie2025年04月02日 satoshie
toyozo32025年04月01日 toyozo3
ya--mada2025年04月01日 ya--mada
ranto3811242025年04月01日 ranto381124
sskoji2025年03月31日 sskoji

気に入った記事をブックマーク

エントリーの編集

タイトルガイドライン

ブックマークしました

おすすめタグタグについて

よく使うタグすべて表示

国立国会図書館のOCRライブラリが凄くよかった件(Windows向け) - Qiita

おすすめタグタグについて

よく使うタグすべて表示

はてなブックマークで関心をシェアしよう

記事へのコメント31件

リンクを埋め込む

プレビュー

関連記事

usersに達しました!

国立国会図書館のOCRライブラリが凄くよかった件(Windows向け) - Qiita

ブックマークしたユーザー

ブックマークしたすべてのユーザー

同時期にブックマークされた記事

公式Twitter

はてなのサービス

よく使うタグ

よく使うタグ

はてなブックマークで
関心をシェアしよう