[フレーム]
はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

気に入った記事をブックマーク

  • 気に入った記事を保存できます
    保存した記事の一覧は、はてなブックマークで確認・編集ができます
  • 記事を読んだ感想やメモを書き残せます
  • 非公開でブックマークすることもできます
適切な情報に変更

エントリーの編集

loading...

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。

タイトルガイドライン

このページのオーナーなので以下のアクションを実行できます

タイトル、本文などの情報を
再取得することができます
コメントを非表示にできます コメント表示の設定

ブックマークしました

ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください

Twitterで共有

ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します

134users がブックマーク コメント 17

ガイドラインをご確認の上、良識あるコメントにご協力ください

0 / 0
入力したタグを追加

現在プライベートモードです 設定を変更する

おすすめタグタグについて

よく使うタグ

漢字のようで漢字でないUnicodeの「康熙部首」と「CJK部首補助」|TechRacho by BPS株式会社

ガイドラインをご確認の上、良識あるコメントにご協力ください

0 / 0
入力したタグを追加

現在プライベートモードです 設定を変更する

おすすめタグタグについて

よく使うタグ

はてなブックマーク

はてなブックマークで
関心をシェアしよう

みんなの興味と感想が集まることで
新しい発見や、深堀りがもっと楽しく

ユーザー登録

アカウントをお持ちの方はログインページ

記事へのコメント17

  • 注目コメント
  • 新着コメント
mr_mayama
PDFコピペすると気づかないうちに原稿に混じるUnicodeの正体がこちら

その他
stilo
同じ埼玉でも文字コードが違う「埼玉埼玉問題」 知らなかったです。 #文字コード #康煕部首

その他
matarillo
おれカネゴンさん

その他
uunfo
「あけてくれ」のおれカネゴン氏、久しぶりすぎる

その他
teo_imperial
ああなるほど。そっち使われるとマッチしないか。

その他
Sampo
PDFにはテキストとしてUnicodeでなくて字形IDが入っているのね。漢字と部首文字は同じ見た目だから同じ字形IDになっていて、そこからコピペしようとするとUnicodeへ変換する段階で部首の方のコードが選ばれてしまったりする

その他
deep_one
案外発生するのよね...PDFからの書き出しでよく化けるって聞いてる。

その他
mn36555023
とりあえず

その他
skam666
"「康煕部首」は部首を表すための特殊な文字(略)このような文字が通常の文字に混じってしまうと、検索できるはずの文字が検索できなくなったりソート順が期待どおりにならなくなったりといった不具合の原因になる"

その他
tsukitaro
漢字と同じ外見の部首が混在すると、検索時やソート時にトラブルの原因となる。

その他
rryu
普通にかな漢字変換しただけでは入力できないと思うのだが、どうやって入力しているのか気になる。OCRもわざわざ部首の方に変換しないはず。

その他
richard_raw
こんなの混入するんだ......。

その他
stilo
stilo 同じ埼玉でも文字コードが違う「埼玉埼玉問題」 知らなかったです。 #文字コード #康煕部首

2020年10月08日 リンク

その他
uunfo
uunfo 「あけてくれ」のおれカネゴン氏、久しぶりすぎる

2020年10月08日 リンク

その他
napsucks
メモ帳にコピペするとフォントサイズが全然異なって縦につぶれた感じで表示されるのでわかる。pptのメイリオフォントをテキストにコピペするとなるらしいという未確認情報も。

その他
teo_imperial
teo_imperial ああなるほど。そっち使われるとマッチしないか。

2020年10月08日 リンク

その他
Sampo
Sampo PDFにはテキストとしてUnicodeでなくて字形IDが入っているのね。漢字と部首文字は同じ見た目だから同じ字形IDになっていて、そこからコピペしようとするとUnicodeへ変換する段階で部首の方のコードが選ばれてしまったりする

2020年10月08日 リンク

その他
maninthemiddle
これを使って「天安門」とか「香港加油」のメッセージ作ってる人いたな

その他
atsushingo
へぇ〜

その他
t-murachi
検出修正スクリプトもまま埋め込みだとかえって何やってるか判らんのでコード番号で書いたほうがむしろ親切な気もする( ́・ω・`)

その他
matarillo
matarillo おれカネゴンさん

2020年10月07日 リンク

その他
mr_mayama
mr_mayama PDFコピペすると気づかないうちに原稿に混じるUnicodeの正体がこちら

2020年10月07日 リンク

その他

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

リンクを埋め込む

以下のコードをコピーしてサイトに埋め込むことができます

プレビュー
アプリのスクリーンショット
いまの話題をアプリでチェック!
  • バナー広告なし
  • ミュート機能あり
  • ダークモード搭載
アプリをダウンロード

関連記事

usersに達しました!

さんが1番目にブックマークした記事「漢字のようで漢字...」が注目されています。

気持ちをシェアしよう

ツイートする

漢字のようで漢字でないUnicodeの「康熙部首」と「CJK部首補助」|TechRacho by BPS株式会社

きっかけ 以下のツイートで「埼玉埼玉問題」と康煕部首を知りました。 「埼玉」と「埼玉」の話。unicode... きっかけ 以下のツイートで「埼玉埼玉問題」と康煕部首を知りました。 「埼玉」と「埼玉」の話。unicodedata.normalize('NFKC', '「埼玉」と「埼玉」') でいけそう https://t.co/kte0sxDvZT — Haruhiko Okumura (@h_okumura) July 11, 2020 康煕部首とは 一丨丶丿乙亅二亠人儿入八冂冖冫几凵刀力勹匕匚匸十卜卩厂厶又口囗土士夂夊夕大女子宀寸小尢尸屮山巛工己巾干幺广廴廾弋弓彐彡彳心戈戶手支攴文斗斤方无日曰月木欠止歹殳毋比毛氏气水火爪父爻爿片牙牛犬玄玉瓜瓦甘生用田疋疒癶白皮皿目矛矢石示禸禾穴立竹米糸缶网羊羽老而耒耳聿肉臣自至臼舌舛舟艮色艸虍虫血行衣襾見角言谷豆豕豸貝赤走足身車辛辰辵邑酉釆里金長門阜隶隹雨靑非面革韋韭音頁風飛食首香馬骨高髟鬥鬯鬲鬼魚鳥鹵鹿麥麻黃黍黑黹黽鼎鼓鼠鼻齊齒龍龜龠 KangXi Radica

ブックマークしたユーザー

  • diveintounlimit2024年12月19日 diveintounlimit
  • techtech05212024年04月07日 techtech0521
  • saken6492023年03月31日 saken649
  • deep_one2023年02月13日 deep_one
  • nhayato2022年07月01日 nhayato
  • mn365550232021年06月14日 mn36555023
  • skam6662021年03月25日 skam666
  • tsukitaro2021年01月27日 tsukitaro
  • thotentry_hatebu1972020年12月12日 thotentry_hatebu197
  • tanakakazu2020年10月09日 tanakakazu
  • rryu2020年10月08日 rryu
  • richard_raw2020年10月08日 richard_raw
  • vostochnaya2020年10月08日 vostochnaya
  • theta2020年10月08日 theta
  • mas-higa2020年10月08日 mas-higa
  • shogo08092020年10月08日 shogo0809
  • somathor2020年10月08日 somathor
  • stilo2020年10月08日 stilo
すべてのユーザーの
詳細を表示します

ブックマークしたすべてのユーザー

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

同時期にブックマークされた記事

いま人気の記事 - 企業メディア

企業メディアをもっと読む

はてなブックマーク

公式Twitter

はてなのサービス

Copyright © 2005-2025 Hatena. All Rights Reserved.
設定を変更しましたx

AltStyle によって変換されたページ (->オリジナル) /