- Codepage 950
-
Big5 ist eine Zeichenkodierung für traditionelle chinesische Schriftzeichen. Sie kodiert 13.062 chinesische Schriftzeichen (zwei Schriftzeichen sind allerdings doppelt kodiert) und ist bei weitem der am meisten benutzte Zeichensatz in der Republik China (Taiwan). Der Name Big5 leitet sich davon ab, dass dieser Standard von den fünf größten taiwanischen Computerherstellern gemeinsam entwickelt wurde.
Inhaltsverzeichnis
Geschichte
Bevor Big5 existierte, wurden in Taiwan verschiedene zueinander inkompatible Zeichensätze wie IBM 5550 verwendet. Big5 sollte diese Zeichensätze ablösen und wurde 1984 eingeführt.
Nach der Einführung fand Big5 große Verbreitung und wurde u. a. in veränderter Form in Windows als Codepage 950 eingeführt. Später wurde CNS 11643 eingeführt, um Big5 abzulösen, dieses Vorhaben scheiterte jedoch. Aufgrund dessen wurde Big5 selber 2003 zum offiziellen Standard Taiwans erklärt.
Außer in Taiwan wird Big5 in Hongkong und Macao verwendet, die ebenfalls Langzeichen benutzen.
Aufbau und Struktur
Big5 ist ein variabler 16-Bit-Zeichensatz. Die Zeichen im Bereich von 0x00-0x7F werden in 8 Bits kodiert und sind offiziell unbelegt, in der Praxis entsprechen diese Zeichen jedoch meist ASCII. Die Zeichen im Bereich 0x80-0xFE werden in 16 Bits kodiert, wobei das zweite Byte im Bereich 0x40-0x7E und 0xA1-0xFE liegt.
Big5 ist in mehrere Bereiche eingeteilt:
- Der Bereich von 0x8140-0xA0FE ist reserviert für private Nutzung.
- Der Bereich von 0xA140-0xA3FF kodiert Satzzeichen, das griechische Alphabet und Symbole.
- Der Bereich von 0xA440-0xC67E kodiert chinesische Schriftzeichen, die zuerst nach Strichen und dann nach Radikal sortiert werden.
- Der Bereich von 0xC6A1-0xC8FE ist reserviert für private Nutzung.
- Der Bereich von 0xC940-0xF9D5 kodiert weitere chinesische Schriftzeichen, die ebenfalls zuerst nach Strichen und dann nach Radikal sortiert werden.
- Der Bereich von 0xF9D6-0xFEFE ist reserviert für private Nutzung.
Erweiterungen
Da Big5 viele benötigte Zeichen fehlen, haben sowohl Unternehmen als auch staatliche Institute eigene Erweiterungen zu Big5 entwickelt.
E-Ten
E-Ten hat für ihr Betriebssystem einige Zeichen aus dem IBM 5550-Zeichensatz hinzugefügt:
- Der Bereich 0xA3C0-0xA3E0 enthält Steuerzeichen.
- Der Bereich 0xC6A1-0xC875 enthält eingekreiste und eingeklammerte Ziffern, Radikale, japanische Kana sowie die kyrillische Schrift.
- Der Bereich 0xF9D6-0xF9FE enthält sieben zusätzliche chinesische Schriftzeichen sowie Rahmenzeichnung.
Microsoft
Microsoft hat für Windows die Codepage 950 erstellt, die praktisch identisch zu Big5 ist, aber zusätzlich die Zeichen aus dem Bereich 0xF9D6-0xF9FE der E-Ten-Erweiterungen sowie das Eurozeichen enthält.
HKSCS
Hongkong benutzt ebenfalls Big5. Da dieser Zeichensatz jedoch viele benötigte Zeichen für das Kantonesische nicht enthält, hat Hongkong den Hong Kong Supplementary Character Set entwickelt, der auf Big5 basiert, jedoch viele zusätzliche Schriftzeichen enthält.
Weblinks
Wikimedia Foundation.