- Codepage 936
-
Windows-Codepages 874 Thai 932 Japanisch 936 Vereinfachtes Chinesisch 949 Koreanisch 950 Traditionelles Chinesisch 1250 Mitteleuropäisch 1251 Kyrillisch 1252 Westeuropäisch 1253 Griechisch 1254 Türkisch 1255 Hebräisch 1256 Arabisch 1257 Baltisch 1258 Vietnamesisch GBK (chin. 汉字内码扩展规范) ist ein chinesischer Zeichensatz. Er erweitert GB2312 um traditionelle Schriftzeichen sowie um Schriftzeichen, die nach der Einführung von GB2312 1981 vereinfacht wurden.
Geschichte
1993 wurde Unicode 1.1 veröffentlicht, das 20.902 chinesische Schriftzeichen enthält. Die chinesische Regierung hat daraufhin GB13000.1-93 veröffentlicht, welcher 1:1 identisch zu Unicode 1.1 ist. Um die Lücke zwischen diesem Standard und dem älteren GB2312 zu überbrücken, wurde auch GBK eingeführt, das GB2312 um die Zeichen aus GB13000.1-93 erweitert. 1995 wurde GBK um 95 weitere Schriftzeichen erweitert.
In Windows 95 wurde GBK als Codepage 936 in unveränderter Form übernommen. Dadurch stieg die Verbreitung von GBK enorm. Später wurde das Eurozeichen zur Codepage 936 hinzugefügt, was die Codepage inkompatibel zu GBK machte.
Seit 2000 ist GBK offiziell von GB18030 abgelöst.
Aufbau
GBK ist eine variable 16-Bit-Kodierung, d. h. ein Zeichen kann entweder ein oder zwei Byte groß sein. Die Zeichen im Bereich 0x00-0x7F sind identisch zu ASCII und bestehen aus nur einem Byte. Die Zeichen im Bereich 0x81-0xFE hingegen bestehen aus 2 Bytes.
Der Zweibytebereich ist in acht Levels eingeteilt:
GBK-Levels Level 1. Byte 2. Byte Verfügbare Codepunkte Zeichen GB 18030 GBK 1.0 GB 2312 Level GBK/1 A1
–A9
A1
–FE
846 728 717 682 Level GBK/2 B0
–F7
A1
–FE
6,768 6,763 6,763 Level GBK/3 81
–A0
40
–FE
außer7F
6,080 6,080 Level GBK/4 AA
–FE
40
–A0
außer7F
8,160 8,160 Level GBK/5 A8
–A9
40
–A0
außer7F
192 166 benutzerdefiniert AA
–AF
A1
–FE
564 benutzerdefiniert F8
–FE
A1
–FE
658 benutzerdefiniert A1
–A7
40
–A0
außer7F
672 insgesamt: 23,940 21,897 21,886 7,445 Weblinks
Wikimedia Foundation.