heangfat/encode

Folders and files

Name		Name	Last commit message	Last commit date
Latest commit History 321 Commits
字樣		字樣
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
倭簡字.json		倭簡字.json
字式撮要.md		字式撮要.md
宂碼彙.json		宂碼彙.json
宂碼表.js		宂碼表.js
形近字彙.txt		形近字彙.txt
文本劃一.py		文本劃一.py
異體字彙.json		異體字彙.json

Repository files navigation

文字編碼

介紹

文字編碼資料和處理方法。現含萬殘碼之宂碼和部件稍訛重構之資料。萬殘碼之「宂碼」指部件、結構全同而異碼者,僅筆迹稍異而已。此類本應認同,而別之以異體綴碼。分開編碼,不啻干擾檢索,影響造字,且同一構件在各字中分合標準不一,令用字者无所適從.亦浪費了基本平面之寶貴碼位。這嚴重阻礙了漢字之信息化。茲總結之,以饗天下學者、用戶。

宂碼表凡例

每字正碼居首,次舉諸宂碼,以利編程。
僅涉及基本平面中 u3400~9FFF 區段(刨除六十四卦,即基本集和擴充A集)。部首、兼容(uF900)等區段,九成以上是宂碼,网上已有映射數據,茲不贅。
草書楷化和輪廓字,如車车、門门、飠饣、肅粛肃等,已見于諸正簡對應表,故原則上不統計。偶有因其他部件而涉及者,如絕絶绝、說説说、綠緑绿,則附之于末。
部件同而結構異者,如峯峰、羣群、鑒鑑等,理應區別,不是宂碼,故不在統計之列。

稍訛重構表說明

筆畫稍訛,導致部件變化,進而理據重構,而音義不變。雖非宂碼,卻亦影響搜索、分析。故附列于茲。

參與貢獻

歧(Fork)庫
新建 Feat_xxx 分支
增補宂碼
新建 Pull Request

About

No description, website, or topics provided.

Releases

No releases published

Packages

No packages published

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

License

Uh oh!

heangfat/encode

Folders and files

Latest commit

History

Repository files navigation

文字編碼

介紹

宂碼表凡例

稍訛重構表說明

參與貢獻

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages

Contributors 2

Languages

License

heangfat/encode

Folders and files

Latest commit

History

Repository files navigation

文字編碼

介紹

宂碼表凡例

稍訛重構表說明

參與貢獻

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages