ISO/IEC 2022

ISO/IEC 2022: ISO/IEC 2022, Informationstechnologie – Zeichensatzstruktur- und -erweiterungstechniken (englisch Information Technology—Character code structure and extension techniques) ist ein ISO-Standard, der eine Technik zur Kodierung mehrerer Zeichensätze sowie Sprachen, die nicht in 7 Bits kodiert werden können, definiert.

Der Zeichensatz sollte das Problem unterschiedlicher zueinander inkompatibler Zeichenkodierungen lösen sowie die Kodierung ostasiatischer Schriftsysteme ermöglichen. Ein in ISO 2022 kodierter String kann problemlos durch 7-Bit-Kanäle transportiert werden, welches die Verwendung des Zeichensatzes im Mail- und Usenetverkehr ermöglicht. Mithilfe von meist drei oder vier Byte großen Escapesequenzen kann zwischen mehreren Zeichensätzen geschaltet werden. Pro Escapesequenz können, abhängig von ihrer Definition, entweder 94, 8.836 (in einer 94×94-Matrix) oder 830.584 (in einer dreidimensionalen 94×94×94-Matrix) Zeichen kodiert werden.

Jedoch konnte sich ISO/IEC 2022 nur im ostasiatischen Mailverkehr durchsetzen, für westliche Sprachen wurde keine Version veröffentlicht. Stattdessen wurde Unicode entwickelt, um diese Aufgabe zu erfüllen.

Es gibt drei Versionen von ISO/IEC 2022 für die drei ostasiatischen Schriften, ISO-2022-JP, ISO-2022-KR und ISO-2022-CN.

Inhaltsverzeichnis

1 ISO-2022-JP

2 ISO-2022-KR

3 ISO-2022-CN

4 Weblinks

ISO-2022-JP

ISO-2022-JP kodiert die japanische Schrift. Sie wird häufig im Mailverkehr eingesetzt, ansonsten wird eher auf Shift_JIS oder EUC-JP zurückgegriffen.

Die ursprüngliche Version wird in RFC 1468 beschrieben und enthält die folgenden vier Escape-Sequenzen:

ESC ( B schaltet zu ASCII (1-Byte)

ESC ( J schaltet zu JIS-Roman (1-Byte)

ESC $ @ schaltet zu JIS X 0208-1978 (2-Byte)

ESC $ B schaltet zu JIS X 0208-1983 (2-Byte)

ISO-2022-JP-1 wird in RFC 2237 beschrieben und fügt eine weitere Escapesequenz hinzu:

ESC $ ( D schaltet zu JIS X 0212-1990 (2-Byte)

ISO-2022-JP-2 wird in RFC 1554 beschrieben und fügt weitere Escapesequenzen zur Unterstützung weiterer Sprachen hinzu. Sie erweitert ISO-2022-JP-1 um die folgenden Escapesequenzen:

ESC $ A schaltet zu GB2312-1980 (2-Byte)

ESC $ ( C schaltet zu KS C 5601-1987 (2-Byte)

ESC . A schaltet zu ISO 8859-1 (1-Byte)

ESC . F schaltet zu ISO 8859-7 (1-Byte)

ISO-2022-JP-3 erweitert die ursprüngliche Version um folgende Escapesequenzen:

ESC ( I schaltet zu JIS X 0201 (1-Byte)

ESC $ ( O schaltet zu JIS X 0213-2000, Plane 1 (2-Byte)

ESC $ ( P schaltet zu JIS X 0213-2000, Plane 2 (2-Byte)

ISO-2022-JP-2004 erweitert ISO-2022-JP-3 um die folgende Escapesequenz:

ESC $ ( Q schaltet zu JIS X 0213-2004, Plane 1 (2-Byte)

ISO-2022-KR

ISO-2022-KR kodiert die koreanische Schrift und wird neben EUC-KR auf koreanischen Websites verwendet. Sie enthält nur eine einzige Escapesequenz:

ESC $ ( C schaltet zu KS C 5601-1987 (2-Byte)

ISO-2022-CN

ISO-2022-CN kodiert die chinesische Schrift (sowohl Kurz- als auch Langzeichen) und wird in RFC 1922 beschrieben. Sie wird fast nie verwendet, EUC-CN bzw. Big5 und im Mailverkehr HZ sind viel häufiger anzutreffen. Die Kodierung enthält die folgenden Escapesequenzen:

ESC $ ( A schaltet zu GB2312-1980 (2-Byte)

ESC $ ( G schaltet zu CNS 11643-1992, Plane 1 (2-Byte)

ESC $ ( H schaltet zu CNS 11643-1992, Plane 2 (2-Byte)

ISO-2022-CN-EXT erweitert den ursprünglichen Zeichensatz um die folgenden Escapesequenzen:

ESC $ ( E schaltet zu ISO-IR-165 (2-Byte)

ESC $ ( I schaltet zu CNS 11643-1992, Plane 3 (2-Byte)

ESC $ ( J schaltet zu CNS 11643-1992, Plane 4 (2-Byte)

ESC $ ( K schaltet zu CNS 11643-1992, Plane 5 (2-Byte)

ESC $ ( L schaltet zu CNS 11643-1992, Plane 6 (2-Byte)

ESC $ ( M schaltet zu CNS 11643-1992, Plane 7 (2-Byte)

Weblinks

ECMA 35 (identisch zu ISO 2022)

Kategorien:
Zeichenkodierung
Zeichenkodierung für die japanische Schrift
Zeichenkodierung für die chinesische Schrift
Zeichenkodierung für die koreanische Schrift
ISO-Norm
IEC-Norm

Игры ⚽ Поможем сделать НИР

Schlagen Sie auch in anderen Wörterbüchern nach:

ISO/IEC 2022 — ISO 2022, more formally ISO/IEC 2022 Information Technology Character code structure and extension techniques , is an ISO standard (equivalent to the ECMA standard ECMA 35) specifying * a technique for including multiple character sets in a… … Wikipedia
ISO/IEC 2022:1994 — изд.4 T JTC 1/SC 2 Информационные технологии. Структура кода символов и методы расширения Изменения и дополнения: – ISO/IEC 2022:1994/Cor.1:1999 (изд.1 JTC 1/SC 2) раздел 35.040 … Стандарты Международной организации по стандартизации (ИСО)
ISO/IEC 8859-1 — ISO 8859 1, more formally cited as ISO/IEC 8859 1 is part 1 of ISO/IEC 8859, a standard character encoding of the Latin alphabet. It is less formally referred to as Latin 1. It was originally developed by the ISO, but later jointly maintained by… … Wikipedia
ISO/IEC 8859-11 — ISO/IEC 8859 11:2001, Information technology 8 bit single byte coded graphic character sets Part 11: Latin/Thai alphabet, is part of the ISO/IEC 8859 series of ASCII based standard character encodings, first edition published in 2001. It is… … Wikipedia
ISO/IEC 8859-8 — ISO 8859 8, more formally cited as ISO/IEC 8859 8 (but not as Latin 8!), is part 8 of ISO/IEC 8859, a standard character encoding defined by ISO.ISO 8859 8 contains all the Hebrew letters (no Hebrew vowel signs). ISO 8859 8:1988, more commonly… … Wikipedia
ISO/IEC 8859-6 — ISO/IEC 8859 6:1999, Information technology 8 bit single byte coded graphic character sets Part 6: Latin/Arabic alphabet, is part of the ISO/IEC 8859 series of ASCII based standard character encodings, first edition published in 1987. It is… … Wikipedia
ISO/IEC 8859-7 — ISO 8859 7, also known as Greek, is an 8 bit character encoding, part of the ISO 8859 standard. It was designed originally to cover the modern Greek language as well as mathematical symbols derived from the Greek.The original 1987 version of the… … Wikipedia
ISO/IEC 8859-2 — ISO 8859 2, more formally cited as ISO/IEC 8859 2 or less formally as Latin 2, is part 2 of ISO/IEC 8859, a standard character encoding defined by ISO. It encodes what it refers to as Latin alphabet no. 2, consisting of 191 characters from the… … Wikipedia
ISO/IEC 8859-13 — ISO 8859 13, also known as Latin 7 or Baltic Rim , is an 8 bit character encoding, part of the ISO 8859 standard. It was designed originally to cover the Baltic languages, and added characters missing from the earlier encodings ISO 8859 4 and ISO … Wikipedia
ISO/IEC 8859-16 — ISO 8859 16, also known as Latin 10 or South Eastern European , is an 8 bit character encoding, part of the ISO 8859 standard. It was designed to cover Albanian, Croatian, Hungarian, Polish, Romanian and Slovenian, but also French, German,… … Wikipedia

Academic dictionaries and encyclopedias

ISO/IEC 2022

Inhaltsverzeichnis

ISO-2022-JP

ISO-2022-KR

ISO-2022-CN

Weblinks

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Academic dictionaries and encyclopedias

Deutsch Wikipedia

ISO/IEC 2022

Inhaltsverzeichnis

ISO-2022-JP

ISO-2022-KR

ISO-2022-CN

Weblinks

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Direct link