Zeichensatztabelle

Zeichensatztabelle

Eine Zeichensatztabelle (oder kurz: Zeichentabelle) ist eine Tabelle mit der Zeichenkodierung eines Computerzeichensatzes, in der jedem druck- und darstellbaren Zeichen und den wichtigsten Steuerzeichen eine Codierung als Bytewert zugewiesen wird. Weitere Bezeichnungen sind Codeseite und Codepage von IBM und Microsoft (IBM übersetzt den Begriff meistens, Microsoft in neueren Betriebssystemen nicht mehr),[1] sowie Character Map von Apple für den Macintosh. Im Deutschen besitzt der windowsspezifische Begriff Codepage die größte Verbreitung. In der deutschen Fachliteratur sind Zeichensatz oder Zeichensatztabelle die üblichen Entsprechungen, wenn der Bezug auf ein bestimmtes Betriebssystem vermieden wird.

Auf Computern dargestellte Zeichen werden bei der Programmierung entsprechend einer Tabelle codiert, davon rührt der eigentliche Name. Für die Codierung gibt es beispielsweise 256 Zeichen, die in einer Tabelle von 0 bis 255 dargestellt sind. Der Wert ergibt sich aus dem zur Verfügung stehenden Oktett (acht Bit): 28 = 256. Die erste Hälfte (Zeichen 1 bis 126) ist dabei in fast allen Zeichensatztabellen identisch mit ASCII – ausgenommen sind die EBCDIC-Zeichensatztabellen von IBM-Großrechnern. Vereinzelt gibt es Zeichensatztabellen mit mehr als 8 Bits pro Zeichen, insgesamt resultieren daraus dann mehr als 256 Zeichen.

Zu unterscheiden sind die hier abgehandelten Zeichensatztabellen nach Industriestandards und nach nationalen und internationalen Normen. Eine solche internationale Norm ist ISO 8859. In Unicode finden alle Zeichen gebräuchlicher Zeichensatztabellen eine Eins-zu-Eins-Entsprechung.

IBM hat viele verschiedene Zeichensatztabellen entworfen und weiterentwickelt, der Begriff kam aber in erster Linie im Zusammenhang mit IBM-PCs und kompatiblen Plattformen auf. Die relevanten Tabellen unter MS-DOS, später Microsoft Windows sind Codeseite 437 und Codeseite 1252. Für die Eingabeaufforderung einer deutschen Windows-Version wird standardmäßig Codeseite 850 verwendet.

Während für komplexere Dateiformate, etwa von Textverarbeitungsprogrammen, bei HTML oder XML, die Zeichenkodierung entweder einem festen Standard entspricht oder im Dokument selbst angegeben ist, fehlt diese Information bei einfachen Textdateien. Auch für die korrekte Anzeige von Dateinamen kann eine passende Zeichensatztabelle nötig sein.

Je nach Betriebssystemversion und Einstellung der Eingabeaufforderung (Kommandozeile) kann auf jedem Rechner eine unterschiedliche Zeichensatztabelle aktiv sein. Hieraus resultiert, dass deutsche Texte mit Umlauten oder Eszett in Textdateien auf ausländischen Computern – oder auch schon beim Übergang von MS-DOS auf Microsoft Windows  – oft nicht richtig dargestellt werden können. Die Ursache sind in der Zeichentabelle fehlende Umlaute oder die unterschiedliche Zuordnung der Umlaute unter anderen Zeichennummern.

Die Änderung der Zeichensatztabelle in einer Eingabeaufforderung (unter MS Windows etwa mit dem Befehl chcp) wirkt nur auf diese Eingabeaufforderung und die in deren Fenster laufenden Programme, nicht aber auf andere Programme, die im System ausgeführt werden.

Siehe auch

Einzelnachweise

  1. Microsoft: Microsoft MS-DOS 6.2, Überschrift Seite 261: Zeichensatztabellen (Codeseitentabellen); in der Onlinehilfe von Microsoft Windows 2000 und höher wird der deutsche Begriff nicht mehr verwendet, allerdings noch das Systemprogramm Zeichentabelle zur Verwendung von Sonderzeichen beschrieben; unter den Regions- und Sprachoptionen lassen sich Codepagekonvertierungstabellen installieren

Wikimedia Foundation.

Игры ⚽ Нужен реферат?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Brother LW-Reihe — Die LW Reihe ist eine Abfolge verschiedener Schreibmaschinenmodelle mit Diskettenlaufwerk des Büromaschinenherstellers Brother. Inhaltsverzeichnis 1 Die LW Reihe 2 Generationen 3 Typenvarianten …   Deutsch Wikipedia

  • Buchstabensalat — Als Buchstabensalat wird umgangssprachlich ein Durcheinander von Zeichen mit nicht oder nur schwer erkennbarem Sinn bezeichnet. Er wird zum Beispiel durch fehlerhafte Druckertreiber oder bei Tastaturtests produziert. Auch kryptographisch… …   Deutsch Wikipedia

  • Character map — Eine Codepage ist eine Tabelle mit einer Zeichenkodierung verschiedener Zeichen, traditionell geprägt von IBM. Apple verwendet für den Macintosh den gleichbedeutenden Begriff Character Map. Im Deutschen nutzt man eher das englische Original, da… …   Deutsch Wikipedia

  • Code-Wert — Ein Code Wert (auch: Code Punkt; engl. code point ) bezeichnet die Position eines Zeichens in einer Zeichensatztabelle. Für jedes Zeichen gibt es einen eindeutigen Code in der jeweiligen Tabelle. So hat zum Beispiel das große A den Code 0x41… …   Deutsch Wikipedia

  • Codepage — Eine Codepage ist eine Tabelle mit einer Zeichenkodierung verschiedener Zeichen, traditionell geprägt von IBM. Apple verwendet für den Macintosh den gleichbedeutenden Begriff Character Map. Im Deutschen nutzt man eher das englische Original, da… …   Deutsch Wikipedia

  • Codepunkt — Ein Code Wert (auch: Code Punkt; engl. code point ) bezeichnet die Position eines Zeichens in einer Zeichensatztabelle. Für jedes Zeichen gibt es einen eindeutigen Code in der jeweiligen Tabelle. So hat zum Beispiel das große A den Code 0x41… …   Deutsch Wikipedia

  • Compose-Taste — Compose Taste, hier mit Feststellfunktion und Kontrolldiode Die Compose Taste (englisch compose: zusammensetzen) ist eine Taste auf der Computertastatur, nach deren Drücken die folgenden Tastendrücke zusammengefasst werden, um ein nicht in der… …   Deutsch Wikipedia

  • MS-DOS — Bildschirmfoto …   Deutsch Wikipedia

  • MSDOS — MS DOS Entwickler Microsoft (ursprünglich SCP/Tim Paterson) Version 6.22 (1994) Abstammung …   Deutsch Wikipedia

  • MS DOS — Entwickler Microsoft (ursprünglich SCP/Tim Paterson) Version 6.22 (1994) Abstammung …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”