ISO/IEC 2022

ISO/IEC 2022

ISO/IEC 2022, Informationstechnologie – Zeichensatzstruktur- und -erweiterungstechniken (englisch Information Technology—Character code structure and extension techniques) ist ein ISO-Standard, der eine Technik zur Kodierung mehrerer Zeichensätze sowie Sprachen, die nicht in 7 Bits kodiert werden können, definiert.

Der Zeichensatz sollte das Problem unterschiedlicher zueinander inkompatibler Zeichenkodierungen lösen sowie die Kodierung ostasiatischer Schriftsysteme ermöglichen. Ein in ISO 2022 kodierter String kann problemlos durch 7-Bit-Kanäle transportiert werden, welches die Verwendung des Zeichensatzes im Mail- und Usenetverkehr ermöglicht. Mithilfe von meist drei oder vier Byte großen Escapesequenzen kann zwischen mehreren Zeichensätzen geschaltet werden. Pro Escapesequenz können, abhängig von ihrer Definition, entweder 94, 8.836 (in einer 94×94-Matrix) oder 830.584 (in einer dreidimensionalen 94×94×94-Matrix) Zeichen kodiert werden.

Jedoch konnte sich ISO/IEC 2022 nur im ostasiatischen Mailverkehr durchsetzen, für westliche Sprachen wurde keine Version veröffentlicht. Stattdessen wurde Unicode entwickelt, um diese Aufgabe zu erfüllen.

Es gibt drei Versionen von ISO/IEC 2022 für die drei ostasiatischen Schriften, ISO-2022-JP, ISO-2022-KR und ISO-2022-CN.

Inhaltsverzeichnis

ISO-2022-JP

ISO-2022-JP kodiert die japanische Schrift. Sie wird häufig im Mailverkehr eingesetzt, ansonsten wird eher auf Shift_JIS oder EUC-JP zurückgegriffen.

Die ursprüngliche Version wird in RFC 1468 beschrieben und enthält die folgenden vier Escape-Sequenzen:

ISO-2022-JP-1 wird in RFC 2237 beschrieben und fügt eine weitere Escapesequenz hinzu:

ISO-2022-JP-2 wird in RFC 1554 beschrieben und fügt weitere Escapesequenzen zur Unterstützung weiterer Sprachen hinzu. Sie erweitert ISO-2022-JP-1 um die folgenden Escapesequenzen:

ISO-2022-JP-3 erweitert die ursprüngliche Version um folgende Escapesequenzen:

  • ESC ( I schaltet zu JIS X 0201 (1-Byte)
  • ESC $ ( O schaltet zu JIS X 0213-2000, Plane 1 (2-Byte)
  • ESC $ ( P schaltet zu JIS X 0213-2000, Plane 2 (2-Byte)

ISO-2022-JP-2004 erweitert ISO-2022-JP-3 um die folgende Escapesequenz:

  • ESC $ ( Q schaltet zu JIS X 0213-2004, Plane 1 (2-Byte)

ISO-2022-KR

ISO-2022-KR kodiert die koreanische Schrift und wird neben EUC-KR auf koreanischen Websites verwendet. Sie enthält nur eine einzige Escapesequenz:

ISO-2022-CN

ISO-2022-CN kodiert die chinesische Schrift (sowohl Kurz- als auch Langzeichen) und wird in RFC 1922 beschrieben. Sie wird fast nie verwendet, EUC-CN bzw. Big5 und im Mailverkehr HZ sind viel häufiger anzutreffen. Die Kodierung enthält die folgenden Escapesequenzen:

ISO-2022-CN-EXT erweitert den ursprünglichen Zeichensatz um die folgenden Escapesequenzen:

Weblinks


Wikimedia Foundation.

Игры ⚽ Нужна курсовая?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • ISO/IEC 2022 — ISO 2022, more formally ISO/IEC 2022 Information Technology Character code structure and extension techniques , is an ISO standard (equivalent to the ECMA standard ECMA 35) specifying * a technique for including multiple character sets in a… …   Wikipedia

  • ISO/IEC 2022:1994 — изд.4 T JTC 1/SC 2 Информационные технологии. Структура кода символов и методы расширения Изменения и дополнения: – ISO/IEC 2022:1994/Cor.1:1999 (изд.1 JTC 1/SC 2) раздел 35.040 …   Стандарты Международной организации по стандартизации (ИСО)

  • ISO/IEC 8859-1 — ISO 8859 1, more formally cited as ISO/IEC 8859 1 is part 1 of ISO/IEC 8859, a standard character encoding of the Latin alphabet. It is less formally referred to as Latin 1. It was originally developed by the ISO, but later jointly maintained by… …   Wikipedia

  • ISO/IEC 8859-11 — ISO/IEC 8859 11:2001, Information technology 8 bit single byte coded graphic character sets Part 11: Latin/Thai alphabet, is part of the ISO/IEC 8859 series of ASCII based standard character encodings, first edition published in 2001. It is… …   Wikipedia

  • ISO/IEC 8859-8 — ISO 8859 8, more formally cited as ISO/IEC 8859 8 (but not as Latin 8!), is part 8 of ISO/IEC 8859, a standard character encoding defined by ISO.ISO 8859 8 contains all the Hebrew letters (no Hebrew vowel signs). ISO 8859 8:1988, more commonly… …   Wikipedia

  • ISO/IEC 8859-6 — ISO/IEC 8859 6:1999, Information technology 8 bit single byte coded graphic character sets Part 6: Latin/Arabic alphabet, is part of the ISO/IEC 8859 series of ASCII based standard character encodings, first edition published in 1987. It is… …   Wikipedia

  • ISO/IEC 8859-7 — ISO 8859 7, also known as Greek, is an 8 bit character encoding, part of the ISO 8859 standard. It was designed originally to cover the modern Greek language as well as mathematical symbols derived from the Greek.The original 1987 version of the… …   Wikipedia

  • ISO/IEC 8859-2 — ISO 8859 2, more formally cited as ISO/IEC 8859 2 or less formally as Latin 2, is part 2 of ISO/IEC 8859, a standard character encoding defined by ISO. It encodes what it refers to as Latin alphabet no. 2, consisting of 191 characters from the… …   Wikipedia

  • ISO/IEC 8859-13 — ISO 8859 13, also known as Latin 7 or Baltic Rim , is an 8 bit character encoding, part of the ISO 8859 standard. It was designed originally to cover the Baltic languages, and added characters missing from the earlier encodings ISO 8859 4 and ISO …   Wikipedia

  • ISO/IEC 8859-16 — ISO 8859 16, also known as Latin 10 or South Eastern European , is an 8 bit character encoding, part of the ISO 8859 standard. It was designed to cover Albanian, Croatian, Hungarian, Polish, Romanian and Slovenian, but also French, German,… …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”