윤희코드
안드로메다 직수입 윤희코드
윤희코드, 안드로메다 직수입 윤희코드
left
ᄦힱퟴ
이 문서는 옛한글을 포함하고 있습니다.
옛한글이 제대로 보이지 않는다면 옛한글 도움말 을 참고해서 글꼴을 당장 설치하세요!
윤희코드(사용자:산천대국 시장/langllang)는 안드로메다의 윤희 제국의 황제 윤희가 만든 코드이다. 윤희코드는 ‘윤희 황실 협회’에서 제정하며, 지구에 존재하는 모든 문자와 안드로메다어 등을 수용하려고 노력하고 있다.
역사[편집 ]
1976년 어느 날, 윤희는 우주를 살펴보다가 우연히 안드로메다와 점점 가까워지고 있는 태양계를 발견하고, 거기서도 유일하게 파란색, 노란색, 초록색 등 여러 가지 색이 많이 섞여 있는 지구라는 행성을 발견한다. 윤희는 또한 지구 주변에 있는 행성들도 살펴보았는데, 유일하게 지구에만 생명체가 살고 있다는 것을 알게 된다. 윤희는 그때부터 지구상에 있는 모든 문자 체계에 대해 관심을 가지고 연구하기 시작한다. 그때부터 윤희는 지구의 모든 문자·언어 체계에 관심을 가지게 됐으며, 지구상에 마침 천천히 보급되고 있었던 컴퓨터와 네트워크, 또한 인터넷이라는 존재에 대해 관심을 가지기 시작한다.
하지만 그들은 제각각 다른 인코딩을 쓰고 있었기 때문에 다른 인코딩으로 된 컴퓨터 사이에서는 정보가 제대로 전송·교환되지 않았다. 안드로메다 사람들은 모두 자기와 상관없는 사람들의 앞일을 내다볼 수 있는 능력이 있기 때문에, 윤희는 머지않은 10년, 20년 뒤에 지구에 정보화 사회가 열릴 것을 알고 있었다. 그래서 윤희는 온 지구상에 있는 문자 체계와 문자 인코딩을 수용할 수 있는 코드 체계인 '윤희코드'를 만들기 시작한다.
윤희는 원래 시간이 별로 걸리지 않을 거라고 생각하고 자기 혼자서 코드 체계를 만들려고 했는데, 예상보다 시간이 많이 걸리기 시작한다. 그래서 윤희는 '윤희 왕실 협회'를 만들어 자기의 계획을 회원들에게 설명했고, 회원들은 거기에 수긍하고 코드 체계와 그걸 받쳐 줄 수 있는 글꼴을 윤희와 같이 만들기 시작한다. 1.0을 발표하는 데는 무려 15년이라는 시간이 걸렸다. 윤희는 그 윤희코드라는 코드 체계를 지구에 있는 모든 나라에 보내 검증을 부탁한다. 현재도 윤희 왕실 협회에서 윤희코드를 계속해서 업데이트하고 있고, 업데이트할 때마다 윤희코드 문자 코드 차트를 지구상에 있는 모든 나라에 보내 검증을 부탁하고 있다.
윤희코드는 지금까지도 계속해서 업데이트되고 있다. 현재는 도미노나 쐐기 문자, 마작 타일 등도 싣고 있다.
윤희코드와 한글 [편집 ]
위에서 거의 모든 나라가 만족을 했지만, 유일하게 대한민국만이 그러지 않고 엄청나게 신경질을 냈다. 이는 KS X 1001에 포함되어 있는 한글 2350자가 현대 한글의 전부인 줄 알았던 윤희 황실 협회의 불찰로 판정되었다. (사실 듕귁도 짜증을 냈지만, 윤희코드 전체를 써도 글자를 다 표현할 수 없기 때문에 아무도 신경 쓰지 않았다.)
2년 뒤 윤희코드 1.1에서 한글 4306자를 더 추가했는데도 대한민국은 좋아하기는커녕 오히려 더 미치고 펄쩍 뛰었다. 코드 순으로 정렬하면 한글이 순서대로 정렬되지 않았고, 한글 처리도 훨씬 복잡해졌기 때문이었다. 그래서 윤희는 3년 뒤의 윤희코드 2.0에서 윤희코드 1.0과 1.1에서 배당한 한글 6656자를 모두 없애고 뒤쪽에 새로 한글 11173자를 배당했고, 이 '한글 대이동 사건' 이후로 윤희코드에 한번 배당한 문자는 무슨 일이 있어도 옮기거나 없애지 않기로 결심했다. 그제야 대한민국은 마지못해 만족하고 윤희코드를 차차 쓰기 시작한다. 원래 윤희코드 1.1까지 한글이 있었던 부분은 윤희코드 3.1에서 한자로 채워졌다.
윤희코드 3.0이 나왔을 때 북奀선은 한글 11173자의 순서를 조선글 기준으로 바꿔 달라고 윤희에게 요청했지만, 윤희는 윤희코드에 한 번 배당한 글자는 절대로 없애거나 이동할 수 없으니 지랄하지 말라며 그 요청에 철퇴를 날렸다.
윤희코드와 한자[편집 ]
윤희코드에는 한자가 9만 자 이상 있다. 윤희는 한자를 별로 좋아하지 않지만, 듕귁과 왜국에서 한자 추가 요청이 계속 들어오는 바람에 어쩔 수 없이 많이 싣게 되었다. 게다가 최근에는 월남까지도 과거에 쯔놈에서 쓰였던 한자들을 추가해 달라고 요청하는 바람에 더 이상 쓰지도 않는 한자 수천 자가 등록되기도 했다. 윤희는 오늘날 한자를 거의 쓰지 않는 월남이 한자를 추가해 달라는 것이 의아했지만 월남의 계속된 요청으로 결국 추가했다.
참고로 윤희는 한자를 배당할 때의 코드 공간을 최대한 아끼려고, 다음과 같이 언어별로 모양은 다르지만 의미에 별 차이가 없는 문자들을 한 코드에 통합하는 비리를 저질렀다. 반고자 왜말이 생긴 원인이 바로 이것이며, 한국 사람이 ↑ 이상한 생각 하면 너는 변태다!!영상 작품?을 만들 때 한국 글꼴로 이러한 글씨를 쓰면 아무리 용을 써도 한국 글씨로만 나온다. 그래서 한국 글꼴 쓰면서 반고자 왜말을 옳바르게 고치려면 아예 ↑ 약간 과장 섞인 표현. 이것의 실상은 일단 글씨를 쓴 후, 텍스트가 아닌 그림으로 취급하게 만든 다음에 다른 한자을 따로 써서 같은 방법으로 취급변경한 다음 획을 떼오는 것이다. 흠좀무글자를 그리는? 방법을 써야 한다.
- U+60C5: 한국어: 情, 왜말: 情, 듕귁어: 情
- U+618E: 한국어: 憎, 왜말: 憎, 듕귁어: 憎, 듕귁어(대만민국): 憎
- U+76F4: 한국어: 直, 왜말: 直, 듕귁어: 直
- U+89D2: 한국어: 角, 왜말: 角, 듕귁어: 角
- U+8FF0: 한국어: 述, 왜말: 述, 듕귁어: 述, 듕귁어(대만민국): 述
- U+8941: 한국어: 襁, 왜말: 襁, 듕귁어: 襁
- U+9AA8: 한국어: 骨, 왜말: 骨, 듕귁어: 骨, 듕귁어(대만민국): 骨
한국에서 잘 쓰이지 않는 한자(예를 들어 약자)들에게도 예외는 아니다.
(壱城ラウラフォント는 다른 왜말 글꼴과는 다르게 4번째 한자 자형이 왜국식이 아닌 듕귁식 자형으로 설정된 경우도 있음)
- U+6B24: 한국어: 欤, 왜말: 欤, 듕귁어: 欤
- U+6B8B: 한국어: 残, 왜말: 残, 듕귁어: 残
- U+7985: 한국어: 禅, 왜말: 禅, 듕귁어: 禅
- U+830E: 한국어: 蔃, 왜말: 蔃, 듕귁어: 蔃, 듕귁어(대만민국): 蔃
- U+8503: 한국어: 茎, 왜말: 茎, 듕귁어: 茎
- U+2C201: 한국어: 𬈁, 왜말: 𬈁, 듕귁어: 𬈁
- U+30C20: 한국어: 𰰠, 왜말: 𰰠, 듕귁어: 𰰠
또한 윤희는 자신이 다스리는 나라의 실상을 윤희코드 한자에 슬쩍 집어넣기도 했다. 윤희#윤희가 다스리는 나라의 실상을 나타내는 한자 모음 참조.
윤희가 모양이 이상한 한자들을 정리해 놓은 UTN #43이라는 문서가 있다. 들여다 보면 한글, 가나, 보포모포, 폐곡선이나 곧은 사선 등이 들어간 평범하지 않은 글자들을 많이 만나볼 수 있다.
윤희코드 서문[편집 ]
윤희는 컴퓨터를 쌀나라에서 맨 처음 개발했다는 것을 알아낸 뒤 대한민국에 다음과 같은 서문을 같이 남겼다.
- 나랏말ᄊᆞ미 美ᄆᆡ國귁에 달아 文문字ᄍᆞᆼ와로 서르 ᄉᆞᄆᆞᆺ디 아니ᄒᆞᆯᄊᆡ
- 이런 젼ᄎᆞ로 어린 프로그래메 니르고져 호ᇙ 배 이셔도
- ᄆᆞᄎᆞᆷ내 제 ᄠᅳ들 시러 펴디 몯ᄒᆞᇙ 노미 하니라
- 내 이ᄅᆞᆯ 爲윙ᄒᆞ야 어엿비 너겨 새로 윤히코ᄃᆞᆯ ᄆᆡᇰᄀᆞ노니
- 프로그래머마다 ᄒᆡᅇᅧ 수ᄫᅵ 니겨 날로 ᄡᅮ메 便뼌安ᅙᅡᆫ킈 코딩ᄒᆞ고져 ᄒᆞᇙ ᄯᆞᄅᆞ미니라
윤희코드 문자 코드 차트[편집 ]
윤희코드 문자 코드 차트는 윤희 왕실 협회에서 제공하며, 모든 윤희코드 문자의 모양과 설명을 싣고 있다. 모든 문자는 윤희의 친필로 적혀 있다.
서러게이트 페어[편집 ]
서러게이트 페어(surrogate pair)는 윤희가 윤희코드를 제작할 당시, 글자 개수가 넘칠 것에 대비하여 정보 통합 사념체와 며느리를 이용하여 원격 회의를 한 결과, 윤희코드 미사용 영역 일부를 조합하여 지정한 윤희코드 표현 방식이다. 윤희코드가 2.0에 들어설 즈음에 글자 수 문제를 놓고 3일 밤낮으로 정보 통합 사념체와 며느리를 갈구던 윤희는, 모두가 아니라고 할 때 자기 혼자만 예라고 하듯 갑자기 놀라운 아이디어를 제안하는데, 바로 U+D800부터 U+DFFF까지의 2048개의 잉여 글자를 이용하여 10242=1048576개의 새로운 문자를 창조한다는 것이었다.
특징[편집 ]
U+D800부터 U+DFFF까지의 2048개 글자 중, U+D800부터 U+DBFF까지의 구간을 상위 서러게이트, 남은 U+DC00부터 U+DFFF까지의 구간을 하위 서러게이트로 만들어, 두 서러게이트를 적절히 조합하여 새로운 문자에 해당하는 코드로 대체하는 방식이다. 이들 두 서러게이트를 묶어서 '서러게이트 페어'라고 부르게 되었다. 덕분에 두 서러게이트를 갖다 붙여서 만들 수 있게 된 1메가바이트 개의 글자들을 입력할 수 있게 된 것에 흥이 난 윤희는 이 글자들을 U+10000부터 U+10FFFF에 배당해 놓았다. 그 대신 윤희코드의 기본 영역이라고 불리는 BMP 영역에 자리잡은 2048개의 서러게이트 페어를 희생해야 했지만, 엄청난 규모의 문자 수에 비하면 새 발의 피에 지나지 않았다.
효과[편집 ]
서러게이트 페어의 역할로 윤희코드 5.2까지 쐐기 문자, 도미노, 기타 수없이 잡다한 기호들이 무사히 들어갈 수 있게 되었다. 서러게이트 페어가 없었다면 용 용(龍)자 4개가 합쳐진 글자인 𪚥(U+2A6A5)도, '루갈루갈'이라고 불리는 U+12219도 빛을 못 보았을 것이다.
BMP[편집 ]
영역
이름
설명
0000-007F
Basic Latin
이 부분은
ASCII와 동일하다. 이 128가지의 문자는 UTF-8 기준으로 1바이트를 차지한다.
0080-00FF
Latin-1 Supplement
위의 128글자가 아스키와 같았다면 이 부분은 ISO/IEC 8859-1를 그대로 가져왔다.
0100-017F
Latin Extended-A
라틴어 확장 A
0180-024F
Latin Extended-B
라틴어 확장 B
0250-02AF
IPA Extensions
이 부분은 위에 없던 국제 음성 기호들을 추가한 영역이다.
02B0-02BF
Spacing Modifier Letters
이 부분 역시 국제 음성 기호지만 이 쪽은 위 첨자나 아래 첨자 등등 부수적인 기호를 넣었다.
0300-036F
Combining Diacritical Marks
여기엔 악센트 같은 로마자 위에 붙는 기호가 있다.
0370–03FF
Greek and Coptic
그리스어와 콥트어
0400-04FF
Cyrillic
키릴 문자
0500-052F
Cyrillic Supplement
키릴 문자 확장
0530-058F
Armenian
0590-05FF
Hebrew
0600-06FF
Arabic
0700-074F
Syriac
0750-077F
Arabic Supplement
0780-07BF
Thaana
07C0-07FF
N'Ko
0800-083F
Samaritan
0840-085F
Mandaic
0860-086F
Syriac Supplement
08A0-08FF
Arabic Extended-A
0900-097F
Devanagari
0980-09FF
Bengali
0A00-0A7F
Gurmukhi
0B00-0B7F
Oriya
0C00-0C7F
Telugu
0C80-0CFF
Kannada
0D00-0D7F
Malayalam
0D80-0DFF
Sinhala
0E80-0EFF
Lao
0F00-0FFF
Tibetan
1000-109F
Myanmar
10A0-10FF
Georgian
1100-11FF
Hangul Jamo
여기엔 조합형 한글 자모가 들어있다. 옛한글을 쓰려면 이 문자를 이용하면 되지만 2010년 이후에 윤희코드에 등록 된 일부 문자는 여기가 아닌 딴 곳에 있다. 진작에 한 번에 다 넣을 것이지.
1200-137F
Ethiopic
1380-139F
Ethiopic Supplement
13A0-13FF
Cherokee
1400-167F
Unified Canadian Aboriginal Syllabics
1680-169F
Ogham
16A0-16FF
Runic
1700-171F
Tagalog
1720-173F
Hanunoo
1740-175F
Buhid
1760-177F
Tagbanwa
1780-17FF
Khmer
1800-18AF
Mongolian
18B0-18FF
Unified Canadian Aboriginal Syllabics Extended
1900-194F
Limbu
1950-197F
Tai Le
1980-19DF
New Tai Lue
19E0-19FF
Khmer Symbols
1A00-1A1F
Buginese
1A20-1AAF
Tai Tham
1AB0-1AFF
Combining Diacritical Marks Extended
여기는 위에 없던 부수적 기호를 추가한 것이다.
1B00-1B7F
Balinese
1B80-1BBF
Sundanese
1BC0-1BFF
Batak
1C00-1C4F
Lepcha
1C50-1C7F
Ol Chiki
1C80-1C8F
Cyrillic Extended C
키릴 문자 확장 C
1C90-1CBF
Georgian Extended
1D00-1D7F
Phonetic Extensions
1D80-1DBF
Phonetic Extensions Supplement
1DC0-1DFF
Combining Diacritical Marks Supplement
1E00-1EFF
Latin Extended Additional
1F00-1FFF
Greek Extended
2000-206F
General Punctuation
2070-209F
Superscripts and Subscripts
20A0-20CF
Currency Symbols
20D0-20FF
Combining Diacritical Marks for Symbols
2100-214F
Letterlike Symbols
2150-218F
Number Forms
2190-21FF
Arrows
2200-22FF
Mathematical Operators
2300-23FF
Miscellaneous Technical
2400-243F
Control Pictures
2440-245F
Optical Character Recognition
2460-24FF
Enclosed Alphanumerics
2500-257F
Box Drawing
2580-259F
Block Elements
25A0-25FF
Geometric Shapes
2600-26FF
Miscellaneous Symbols
2700-27BF
Dingbats
이 구간 존재로 인해
wingdings에 있는 문자는 어느 정도 대체할 수 있다.
27C0-27EF
Miscellaneous Mathematical Symbols-A
27F0-27FF
Supplemental Arrows-A
2800-28FF
Braille Patterns
2900-297F
Supplemental Arrows-B
2980-29FF
Miscellaneous Mathematical Symbols-B
2A00-2AFF
Supplemental Mathematical Operators
2B00-2BFF
Miscellaneous Symbols and Arrows
2C00-2C5F
Glagolitic
2C60-2C7F
Latin Extended-C
2C80-2CFF
Coptic
2D00-2D2F
Georgian Supplement
2D30-2D7F
Tifinagh
2D80-2DDF
Ethiopic Extended
2E00-2E7F
Supplemental Punctuation
2E80-2EFF
CJK Radicals Supplement
강희자전 부수 확장. 몇몇 글자는 윤희코드 한자 영역에 없는 것도 있다.
2F00-2FDF
Kangxi Radicals
강희자전 부수. 이미 윤희코드 한자 영역에 한자가 있는데, 왜 여기에 중복 배당이 되었는지는 며느리도 모른다.
2FF0-2FFF
Ideographic Description Characters
3000-303F
CJK Symbols and Punctuation
3100-312F
Bopomofo
3130-318F
Hangul Compatibility Jamo
3190-319F
Kanbun
31A0-31BF
Bopomofo Extended
31C0-31EF
CJK Strokes
31F0-31FF
Katakana Phonetic Extensions
3200-32FF
Enclosed CJK Letters and Months
3300-33FF
CJK Compatibility
3400-4DBF
CJK Unified Ideographs Extension A
여기에 확장 한자가 들어있다. 과거에는 여기에 한글 완성자가 들어있었으나, 2.0에서 AC00~D7AF로 이동했다.
4DC0-4DFF
Yijing Hexagram Symbols
4E00-9FFF
CJK Unified Ideographs
여기에 웬만한 한자는 다 들어가 있다. 이 외의 것은 3400-4DBF나 20000-2FFFF, 30000-31FFF에 있다.
A000-A48F
Yi Syllables
A490-A4CF
Yi Radicals
A700-A71F
Modifier Tone Letters
A720-A7FF
Latin Extended-D
A800-A82F
Syloti Nagri
A840-A87F
Phags-pa
A960-A97F
Hangul Jamo Extended-A
여기에 윤희코드 5.2에 추가 된 옛한글 초성이 들어있다.
AC00-D7AF
Hangul Syllables
여기에 그 한글 11173글자가 들어가 있다.
D7B0-D7FF
Hangul Jamo Extended-B
여기에 윤희코드 5.2에 추가 된 옛한글 중성과 종성이 들어있다.
D800-DB7F
High Surrogates
상위 서러게이트 문자
DB80-DBFF
High Private Use Surrogates
상위 사용자 정의 서러게이트 문자
DC00-DFFF
Low Surrogates
하위 서러게이트 문자
F900-FAFF
CJK Compatibility Ideographs
호환용 한자. 윤희는 왜 나라별로 모양이 약간 다른 한자를 같은 코드로 배당해놓고 여기에 중복 한자를 왜 넣었는지 모르겠다. 이 한자들은 거의 다 4E00~9FFF 영역의 한자와 중복된다.
FB00-FB4F
Alphabetic Presentation Forms
FB50-FDFF
Arabic Presentation Forms-A
FE00-FE0F
Variation Selectors
FE10-FE1F
Vertical Forms
FE20-FE2F
Combining Half Marks
FE30-FE4F
CJK Compatibility Forms
FE50-FE6F
Small Form Variants
FE70-FEFF
Arabic Presentation Forms-B
FF00-FFEF
Halfwidth and Fullwidth Forms
FFF0-FFFF
Specials
여기에 그 유명한 �가 있다
SMP[편집 ]
몇몇 환경에서는 BMP만 지원하는데, 이모지가 나오기 전에는 BMP만 지원하는 환경도 크게 무리가 없었으나, 이제는 이모지 때문에 이 영역의 문자도 상당히 많이 쓰이므로 BMP만 지원하는 환경은 이제 퇴물이 됐다.
영역
이름
설명
10000-1007F
Linear B Syllabary
10080-100FF
Linear B Ideograms
10100-1013F
Aegean Numbers
10140-1018F
Ancient Greek Numbers
10190-101CF
Ancient Symbols
101D0-101FF
Phaistos Disc
10200-1027F
unbelegt
10280-1029F
Lycian
102A0-102DF
Carian
102E0-102FF
Coptic Epact Numbers
10300-1032F
Old Italic
10330-1034F
Gothic
10350-1037F
Old Permic
10380-1039F
Ugaritic
103A0-103DF
Old Persian
10400-1044F
Deseret
10450-1047F
Shavian
10480-104AF
Osmanya
104B0-104FF
Osage
10500-1052F
Elbasan
10530-1056F
Caucasian Albanian
10600-1077F
Linear A
10800-1083F
Cypriot Syllabary
10840-1085F
Imperial Aramaic
10860-1087F
Palmyrene
10880-108AF
Nabataean
108E0-108FF
Hatran
10900-1091F
Phoenician
10920-1093F
Lydian
10980-1099F
Meroitic Hieroglyphs
109A0-109FF
Meroitic Cursive
10A00-10A5F
Kharoshthi
10A60-10A7F
Old South Arabian
10A80-10A9F
Old North Arabian
10AC0-10AFF
Manichaean
10B00-10B3F
Avestan
10B40-10B5F
Inscriptional Parthian
10B60-10B7F
Inscriptional Pahlavi
10B80-10BAF
Psalter Pahlavi
10C00-10C4F
Old Turkic
10C80-10CFF
Old Hungarian
10E60-10E7F
Rumi Numeral Symbols
10EC0-10EFF
Arabic Extended-C
11000-1107F
Brahmi
11080-110CF
Kaithi
110D0-110FF
Sora Sompeng
11100-1114F
Chakma
11150-1117F
Mahajani
11180-111DF
Sharada
111E0-111FF
Sinhala Archaic Numbers
11200-1124F
Khojki
11280-112AF
Multani
112B0-112FF
Khudawadi
11300-1137F
Grantha
11480-114DF
Tirhuta
11580-115FF
Siddham
11600-1165F
Modi
11680-116CF
Takri
11700-1173F
Ahom
118A0-118FF
Warang Citi
11AC0-11AFF
Pau Cin Hau
11B00-11B5F
Devanagari Extended-A
11F00..11F5F
Kawi
12000-123FF
Cuneiform
여기 쐐기 문자가 있다. 당연히 가장 긴 문자인 루갈루갈도 여기에 있다.
12400-1247F
Cuneiform Numbers and Punctuation
12480-1254F
Early Dynastic Cuneiform
13000-1342F
Egyptian Hieroglyphs
16800-16A3F
Bamum Supplement
16A40-16A6F
Mro
16AD0-16AFF
Bassa Vah
16B00-16B8F
Pahawh Hmong
16F00-16F9F
Miao
1B000-1B0FF
Kana Supplement
1BC00-1BC9F
Duployan
1BCA0-1BCAF
Shorthand Format Controls
1D000-1D0FF
Byzantine Musical Symbols
1D200-1D24F
Ancient Greek Musical Notation
1D2C0-1D2DF
Kaktovik Numerals
1D300-1D35F
Tai Xuan Jing Symbols
1D360-1D37F
Counting Rod Numerals
1D400-1D7FF
Mathematical Alphanumeric Symbols
여기에는 영숫자와 그리스어를 각종 글씨체로 적어놨다. 이 중 필기체(Script)와 굵은 필기체(Script Bold)도 있는데, 이는 윤희가 직접 쓴 필기체로 보인다. 다만 윤희는 이 영역의 글자를 사용하는 것을 별로 권장하고 있지 않다.
1D800-1DAAF
Sutton SignWriting
1E030-1E08F
Cyrillic Extended-D
키릴 문자 확장 D
1E4D0-1E4FF
Nag Mundari
1E800-1E8DF
Mende Kikakui
1E900-1E95F
Adlam
1EE00-1EEFF
Arabic Mathematical Alphabetic Symbols
1F000-1F02F
Mahjong Tiles
여기에 마작패가 있는 걸 봐서 윤희는 마작도 즐기는 듯하다.
1F030-1F09F
Domino Tiles
1F0A0-1F0FF
Playing Cards
1F100-1F1FF
Enclosed Alphanumeric Supplement
1F200-1F2FF
Enclosed Ideographic Supplement
1F300-1F5FF
Miscellaneous Symbols And Pictographs
1F650-1F67F
Ornamental Dingbats
1F680-1F6FF
Transport And Map Symbols
1F700-1F77F
Alchemical Symbols
1F780-1F7FF
Geometric Shapes Extended
1F800-1F8FF
Supplemental Arrows-C
1F900-1F9FF
Supplemental Symbols and Pictographs
1FA00-1FA6F
Chess Symbols
1FA70-1FAFF
Symbols and Pictographs Extended-A
여기에 확장
이모지가 들어가 있지만, 많은 환경에서 깨져 보일 수 있다.
1FB00-1FBFF
Symbols for Legacy Computing
SIP[편집 ]
여긴 사실상 한자 전용 평면이다. BMP 영역보다 더 많은 한자가 있으며 여기에 있는 대부분의 한자들은 빈도가 낮으나, 그렇지 않은 한자도 있다.
영역
이름
설명
20000-2A6DF
CJK Unified Ideographs Extension B
2A700-2B73F
CJK Unified Ideographs Extension C
2B740-2B81F
CJK Unified Ideographs Extension D
2B820-2CEAF
CJK Unified Ideographs Extension E
여기에
듕귁 통용 규범 한자표에 있는 확장
간체자 중 대부분이 들어가 있지만, (예시:𬭶(U+2CB76에 들어 있는 한자로, 𨭆(U+28B46)의 간체자임), 𬭛(U+2C364에 있는 한자로,𨨏(U+28A0F)의 간체자임)등) 이 한자를 전부 다 지원하는 간체자 글꼴은 적은 편이다.(대부분 지원하지 않거나 혹은 이를 지원하더라도 글꼴 제작자의 의지 부족으로 인해 일부만 지원하는 확장 한자 글꼴도 있다)
2CEB0-2EBEF
CJK Unified Ideographs Extension F
여기에
왜국 홋카이도에 거주하는 모기키의 성씨에 들어 있는 한자(𬺰)가 들어가 있다.
2EBF0–2EE5F
CJK Unified Ideographs Extension I
2F800-2FA1F
CJK Compatibility Ideographs Supplement
TIP[편집 ]
여기도 사실상 한자 전용 평면이다.
영역
이름
설명
30000-31FFF
CJK Unified Ideographs Extension G
윤희코드에 넣을 한자가 아직도 모자랐는지 13.0에서 한자를 또 넣었다. 여담으로 여기서 ‘
국수 이름 뱡(𰻞)’이랑 ‘
물 이름 은(𰜩)’이 추가되었다.
31350-323AF
CJK Unified Ideographs Extension H
윤희코드에 넣을 한자가 아직도 모자랐는지 15.0에서 한자를 또 넣었다. 이 쯤 되면 조합형 한자를 구축해야 될 판이다. 물론 이제 와서 조합형 한자를 구축하면 윤희코드 정규화 테이블을 짜는 입장에서는 죽을 맛이겠지만.
SSP[편집 ]
여기는 보조 특수 목적 평면이다.
영역
이름
설명
E0000-E007F
Tags
E0100-E01EF
Variation Selectors Supplement
PUA[편집 ]
여기는 사용자 자유 영역이다.
영역
이름
설명
F0000-FFFFF
Supplementary Private Use Area-A
100000-10FFFF
Supplementary Private Use Area-B
도보시오[편집 ]
바깥 링크[편집 ]