[フレーム]
はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

気に入った記事をブックマーク

  • 気に入った記事を保存できます
    保存した記事の一覧は、はてなブックマークで確認・編集ができます
  • 記事を読んだ感想やメモを書き残せます
  • 非公開でブックマークすることもできます
適切な情報に変更

エントリーの編集

loading...

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。

タイトルガイドライン

このページのオーナーなので以下のアクションを実行できます

タイトル、本文などの情報を
再取得することができます
コメントを非表示にできます コメント表示の設定

ブックマークしました

ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください

Twitterで共有

ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します

384users がブックマーク コメント 37

ガイドラインをご確認の上、良識あるコメントにご協力ください

0 / 0
入力したタグを追加

現在プライベートモードです 設定を変更する

おすすめタグタグについて

よく使うタグ

PDFをコピペするとなぜ"文字化け"が起きてしまうのか 変換テーブル"ToUnicode CMap"が原因だった

384 users logmi.jp

ガイドラインをご確認の上、良識あるコメントにご協力ください

0 / 0
入力したタグを追加

現在プライベートモードです 設定を変更する

おすすめタグタグについて

よく使うタグ

はてなブックマーク

はてなブックマークで
関心をシェアしよう

みんなの興味と感想が集まることで
新しい発見や、深堀りがもっと楽しく

ユーザー登録

アカウントをお持ちの方はログインページ

記事へのコメント37

  • 注目コメント
  • 新着コメント
iww
ちゃんと表示されてるけどコピペするとぐちゃぐちゃになるタイプの難読化PDFってうまくやれば流行るんじゃないかな

その他
junjuns7
官報が、コピペは化ける、テキスト出力すると見えてるのとは違う文章が出る、という非常に厄介なPDFで困ります。

その他
chikoshoot
と ゙お ゙し ゙て ゙た ゙よ ゙お ゙お ゙お ゙お ゙お ゙!

その他
sotter0x
「初見はハ長調で高音の白玉があった」例文の意味が通ってて感動した。

その他
ya--mada
パカパカする画像が貼ってあって読みづらい...

その他
skt244
一部のpdfでコピペしたらリピートみたいになるのはなぜか

その他
htnmiki
面倒だからOCRでいくか

その他
Dai44
何文字も連続しちゃうコピペのときは、ChromeでPDFを開いてコピペするとうまくいくのも、Chromeのせいなのかな

その他
six13
文字化けよりも、ペーストするとコピーした文字が重なりまくる事象をよく見るなあ。

その他
ardarim
定期的に浮上する鉄板ネタ

その他
richard_raw
おのれ康煕字典!(違

その他
Lhankor_Mhy
フォント内蔵の文字コード→グリフマッピングがN対1なのが原因、と。/ その2→https://logmi.jp/tech/articles/324412

その他
tmatsuu
わいわい。コピペできるほうが奇跡

その他
natroun
おもしろい。そういう仕組みになっているのか。例の「アパート」もこれと関係あるのかな。

その他
rryu
グリフから文字コードへの逆変換なので部首漢字などの同一のグリフが割り当てられている文字が化ける可能性があると。

その他
georgew
どういったフォントのグリフを、どこに配置するかという情報だけが存在しているのが普通のPDF > へー、これは知らなかった。文字コードは入ってないんですね。

その他
pmakino
ずっと不思議だった件

その他
deep_one
『文字化けの発生メカニズムとしては、cmapのテーブルで文字コードの「見」が入ってきたとき、正変換してGIDに変換します。2500番ということがわかった。このときに、変換前が898Bだったことを忘れてしまいます』

その他
timetrain
下手するとコピーよりOCRに掛けた方が精度が良かったりするからなあ

その他
itochan
ちゃんとやれば、ちゃんと戻るのに、ちゃんと逆変換していないらしい。次回に期待。

その他
Kmusiclife
前もどこかで見た記事だで

その他
skam666
"PDFの中には(中略)文字コードへの変換テーブルがちゃんと入っている。これはフォントごとに用意されています(中略)コピペできるPDFには、これが入っています。逆にいうと、コピペできないPDFには入っていない"

その他
htnmiki
htnmiki 面倒だからOCRでいくか

2021年05月27日 リンク

その他
mayumayu_nimolove
〜ちゃん大好きってツイートをコピペすると〜しろまるねって変換される技術は割と需要高そう

その他
hello-you
これホント困る。何とかして欲しい

その他
yarumato
"実は大部分のPDFは、普通のテキストが入っていなくて、どういったフォントのグリフ(CIDやGID)を、どこに配置するかという情報だけある。PDFの中身を覗いてみよう。部首文字がないフォントなら文字化けはしない"

その他
threeMonths
qpdfで中身をわかりやすく

その他
Dai44
Dai44 何文字も連続しちゃうコピペのときは、ChromeでPDFを開いてコピペするとうまくいくのも、Chromeのせいなのかな

2021年05月26日 リンク

その他
daishi_n
もともとPDFは「どんな環境でも印刷物と同じに見える」なので、テキスト関係がロクなことになってないのは予想できたが、フォントのコード埋め込んでたか

その他
ardarim
ardarim 定期的に浮上する鉄板ネタ

2021年05月26日 リンク

その他
aburi_engawa
"PDFはすごく昔からあるものなので常にこうではありませんが" えー!と思ったけど日本語埋め込めるようになって20年か。オフィス文書で気軽にボールド指定したいけど後でpdfにすること考えると未だに避けてる

その他
xnissy
そうそう、検索できなくて困るのよー

その他
ebibibi
闇が深いですね...

その他
ya--mada
ya--mada パカパカする画像が貼ってあって読みづらい...

2021年05月26日 リンク

その他
six13
six13 文字化けよりも、ペーストするとコピーした文字が重なりまくる事象をよく見るなあ。

2021年05月26日 リンク

その他
sotter0x
sotter0x 「初見はハ長調で高音の白玉があった」例文の意味が通ってて感動した。

2021年05月26日 リンク

その他
skt244
skt244 一部のpdfでコピペしたらリピートみたいになるのはなぜか

2021年05月26日 リンク

その他
makou
リガチャを戻せるって話かと思ったら、部首に使われやすい字が化けるって話だった。

その他
samehadax
なんでもかんでも元原稿手に入るとは限らないし、どうしてもPDFから起こさなきゃいけない場面出てくるよね... 続きを楽しみにしてます

その他
zgmf-x20a
何言ってるのか伝わらないかもしれませんが、ダブルクオートがそうでなくなるってことありませんか?

その他

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

リンクを埋め込む

以下のコードをコピーしてサイトに埋め込むことができます

プレビュー
アプリのスクリーンショット
いまの話題をアプリでチェック!
  • バナー広告なし
  • ミュート機能あり
  • ダークモード搭載
アプリをダウンロード

関連記事

usersに達しました!

さんが1番目にブックマークした記事「PDFをコピペすると...」が注目されています。

気持ちをシェアしよう

ツイートする

PDFをコピペするとなぜ"文字化け"が起きてしまうのか 変換テーブル"ToUnicode CMap"が原因だった

NTT Tech Conferenceは、NTTグループのエンジニアたちが一堂に会し、NTTグループ内外のエンジニアたちと... NTT Tech Conferenceは、NTTグループのエンジニアたちが一堂に会し、NTTグループ内外のエンジニアたちと技術交流を行うためのカンファレンスです。ここで、細田氏が「PDFのコピペが文字化けするのはなぜか?〜CID/GIDと原ノ味フォント〜」をテーマに話します。まずは文字化けが起こってしまう原因について。 原ノ味フォントの作成者 細田真道氏(以下、細田):細田です。ふだんはNTTグループのどこかでDX仕事をしていますが、今日はぜんぜん仕事とは関係なく、個人的にやっているオープンソースなどの話をしたいと思います。よろしくお願いします。 簡単に自己紹介をします。楽譜を作成するプログラム「LilyPond」のコミッターと、GNUの公式文書フォーマット「Texinfo」のコミッターをしています。あとで話しますが、「原ノ味フォント」を作っていて、すごく似たような名前で「原ノ町」という

ブックマークしたユーザー

  • mk_552024年09月16日 mk_55
  • accordfinal2024年05月26日 accordfinal
  • hroka2023年03月09日 hroka
  • diabah_blue2023年03月09日 diabah_blue
  • richard_raw2022年12月27日 richard_raw
  • dambiyori2022年04月27日 dambiyori
  • Lhankor_Mhy2022年02月18日 Lhankor_Mhy
  • skypenguins2022年01月30日 skypenguins
  • donotthinkfeel2021年08月09日 donotthinkfeel
  • surumesan2021年08月01日 surumesan
  • Narr2021年07月31日 Narr
  • kaokaopink2021年06月26日 kaokaopink
  • heatman2021年06月25日 heatman
  • koma_g2021年06月19日 koma_g
  • hoppie2021年06月19日 hoppie
  • tmatsuu2021年06月19日 tmatsuu
  • moccos_info2021年06月15日 moccos_info
  • emonkak2021年06月08日 emonkak
すべてのユーザーの
詳細を表示します

ブックマークしたすべてのユーザー

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

同時期にブックマークされた記事

いま人気の記事 - 企業メディア

企業メディアをもっと読む

はてなブックマーク

公式Twitter

はてなのサービス

Copyright © 2005-2025 Hatena. All Rights Reserved.
設定を変更しましたx

AltStyle によって変換されたページ (->オリジナル) /