JIS X 0201
Der JIS X 0201, entwickelt 1969, ist die erste japanische Zeichenkodierung, die breitere Anwendung gefunden hat. JIS steht für Japan Industrial Standard, das Gegenstück zur DIN. Der Zeichensatz ist eine Erweiterung des ASCII-Codes von sieben auf acht Bit. Dadurch stehen 128 weitere Schriftzeichen zur Verfügung. Das ist allerdings zu wenig, um das gesamte japanische Schriftsystem mit zwei Silbenschriften und mindestens 2.000 chinesischen Schriftzeichen aufzunehmen. Stattdessen wurde nur eine Silbenschrift implementiert, die Katakana, die bis dahin auch schon in Telegrammen als einzige Schrift zum Einsatz kam. Bereits wenige Jahre später, 1978, wurde dann mit dem JIS C 6226 der erste Schriftsatz auf der Basis von 16 Bit bzw. 2 Byte entwickelt, der mit seinen maximal 65.535 Zeichen eine Implementierung von Kanji ermöglichte. Auf der Basis des JIS C 6226 wurden dann die meisten heute gängigen Schriftsätze für Japanisch entwickelt wie Shift-JIS.
Probleme
[Bearbeiten | Quelltext bearbeiten ]Im JIS X 0201 übernahm an den Codepositionen 0 bis 127 die 7-Bit-Kodierung JIS-Roman, in der zwei Schriftzeichen Backslash (\) und Tilde (~) durch das Yen-Symbol (\) und die Overline ( ̄) ersetzt worden waren. Das hat dazu geführt, dass auf japanischen Computern Pfadangaben unter DOS/Windows als C:\Program Files\
erscheinen.
Eine zweite Spätfolge des Schriftsatzes sind die Half-width-Katakana (Katakana halber Breite). Im JIS X 0201 werden die Katakana durch ein einzelnes Byte repräsentiert, und in den ersten Umsetzungen waren die Katakana auch nicht – wie bis dahin in der japanischen Schrift üblich – im Geviert dargestellt, sondern wie lateinische Buchstaben in halber Breite. In den nachfolgenden Zeichensätzen wurde ein neuer Full-width-Katakana-Block eingeführt, in dem die Katakana erstens zwei Byte belegten und zweitens die normale Breite hatten. Die meisten modernen Zeichenkodierungen enthalten beide Sätze.
Tabelle des ASCII-Erweiterungsbereichs
[Bearbeiten | Quelltext bearbeiten ]-
Hex A1 A2 A3 A4 A5 A6 A7 A8 A9 AA AB AC AD AE AFDez 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175Zeichen 。 「 」 、 ・ ヲ ァ ィ ゥ ェ ォ ャ ュ ョ ッHex B0 B1 B2 B3 B4 B5 B6 B7 B8 B9 BA BB BC BD BE BFDez 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191Zeichen ー ア イ ウ エ オ カ キ ク ケ コ サ シ ス セ ソHex C0 C1 C2 C3 C4 C5 C6 C7 C8 C9 CA CB CC CD CE CFDez 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207Zeichen タ チ ツ テ ト ナ ニ ヌ ネ ノ ハ ヒ フ ヘ ホ マHex D0 D1 D2 D3 D4 D5 D6 D7 D8 D9 DA DB DC DD DE DFDez 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223Zeichen ミ ム メ モ ヤ ユ ヨ ラ リ ル レ ロ ワ ン ゙ ゚
In der Tabelle nicht genannte Zeichen jenseits von 127 (7Fhex) sind nicht belegt.