MBCS

MBCS

Multibyte Character Set (MBCS) bezeichnet Zeichenkodierungen bei denen abhängig vom zu speichernden Zeichen unterschiedlich viele Bytes verwendet werden. Die Bezeichnung character set (Zeichensatz) ist dabei irreführend.

Dies ist zum Beispiel der Fall bei Zeichensätzen die chinesische Zeichen enthalten, von denen es tausende gibt. Mit einer Speicherung von lediglich einem Byte, mit dem westliche Zeichensätze auskommen, ist dies nicht möglich da so maximal 256 Zeichen gespeichert werden können. Zur Lösung dieses Problems werden mehrere Bytes verwendet. Dafür gibt es zwei Möglichkeiten: 1. Wird jedes Zeichen durch die gleiche Anzahl von Bytes repräsentiert oder 2. abhängig vom Zeichen durch eine unterschiedliche Anzahl von Bytes.

Würde man die ca. 90.000 − je nach Zählung − chinesischen Schriftzeichen nach Variante a kodieren müsste man jedes Zeichen mit 3 Bytes kodieren. Damit würden allerdings 99,5% des Speicherplatzes verschenkt werden, da so lediglich 0,5% von 224 ≈ 16,8 Mio., mit 3 Bytes möglichen, verschiedenen Zeichen genutzt werden.

Deswegen wird in solchen Fällen die 2. Variante vorgezogen. Dies wird dadurch realisiert das bestimmte Zeichen (z. B. ASCII-Zeichen) mit nur einem Byte gespeichert werden, andere wiederum mit einem Führungsbyte (leading byte), das angibt das noch ein weiteres Byte benötigt wird, welches wiederum ein Führungsbyte sein kann. Dadurch kann der Speicherplatz effektiver ausgenutzt werden, da abhängig vom Zeichen, 1, 2, … Bytes benutzt werden. Der Nachteil dieser Methode ist, dass, um Zeichen ab einer bestimmten Zeichenposition zu erhalten, die Zeichenkette von Anfang an durchlaufen werden muss, da die Zeichenposition unabhängig von der Byteposition ist. Dies ist bei nach der 1. Variante kodierten Zeichen nicht nötig, da die Byteposition, der Zeichenposition multipliziert der Bytes/Zeichen ist.

Die wichtigsten Vertreter von MBCS sind: UTF-8, UTF-7, Shift-JIS, Big5 und GB2312.

Siehe auch


Wikimedia Foundation.

Игры ⚽ Поможем написать реферат

Schlagen Sie auch in anderen Wörterbüchern nach:

  • MBCS — can refer to:*Member of the British Computer Society a professional qualification / title * multi byte character set a class of character encodings in computing * Marine Biology Case Study used in the AP Computer Science Program of the College… …   Wikipedia

  • MBCS — Member of the British Computer Society (Computing » General) **** Marine Biology Case Study (Academic & Science » Ocean Science) ** Multiple Byte Character Set (Computing » General) * Mixed Byte Character Set (Computing » Databases) …   Abbreviations dictionary

  • MBCS — Multi Byte Character Set …   Acronyms

  • MBCS — Multi Byte Character Set …   Acronyms von A bis Z

  • MBCS — abbr. Member, British Computer Society …   Dictionary of abbreviations

  • MBCS — comp. abbr. Multi Byte Character Set (IBM) …   United dictionary of abbreviations and acronyms

  • British Computer Society — Type Professional Organisation Founded 1957 Origins London Computer Group, The British Computer Society Key people …   Wikipedia

  • Maryland Bible College & Seminary — (MBCS) Established 1988 Type Private Bible college Students 300+ Location Baltimore, Maryland, U.S …   Wikipedia

  • SBCS — Die Bezeichnung Single Byte Character Set (SBCS) wird gelegentlich verwendet um Zeichenkodierungen zu benennen, die lediglich ein Byte zur Darstellung eines Zeichen verwenden. Der Begriff SBCS wird dabei vor allem als Gegensatz zu DBCS und MBCS… …   Deutsch Wikipedia

  • DBCS — This article is about character sets. For other definitions, see DBCS (disambiguation). A double byte character set (DBCS) is a character set that represents each character with 2 bytes. The DBCS supports national languages that contain a large… …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”