- Zeichensatztabelle
-
Eine Zeichensatztabelle (oder kurz: Zeichentabelle) ist eine Tabelle mit der Zeichenkodierung eines Computerzeichensatzes, in der jedem druck- und darstellbaren Zeichen und den wichtigsten Steuerzeichen eine Codierung als Bytewert zugewiesen wird. Weitere Bezeichnungen sind Codeseite und Codepage von IBM und Microsoft (IBM übersetzt den Begriff meistens, Microsoft in neueren Betriebssystemen nicht mehr),[1] sowie Character Map von Apple für den Macintosh. Im Deutschen besitzt der windowsspezifische Begriff Codepage die größte Verbreitung. In der deutschen Fachliteratur sind Zeichensatz oder Zeichensatztabelle die üblichen Entsprechungen, wenn der Bezug auf ein bestimmtes Betriebssystem vermieden wird.
Auf Computern dargestellte Zeichen werden bei der Programmierung entsprechend einer Tabelle codiert, davon rührt der eigentliche Name. Für die Codierung gibt es beispielsweise 256 Zeichen, die in einer Tabelle von 0 bis 255 dargestellt sind. Der Wert ergibt sich aus dem zur Verfügung stehenden Oktett (acht Bit): 28 = 256. Die erste Hälfte (Zeichen 1 bis 126) ist dabei in fast allen Zeichensatztabellen identisch mit ASCII – ausgenommen sind die EBCDIC-Zeichensatztabellen von IBM-Großrechnern. Vereinzelt gibt es Zeichensatztabellen mit mehr als 8 Bits pro Zeichen, insgesamt resultieren daraus dann mehr als 256 Zeichen.
Zu unterscheiden sind die hier abgehandelten Zeichensatztabellen nach Industriestandards und nach nationalen und internationalen Normen. Eine solche internationale Norm ist ISO 8859. In Unicode finden alle Zeichen gebräuchlicher Zeichensatztabellen eine Eins-zu-Eins-Entsprechung.
IBM hat viele verschiedene Zeichensatztabellen entworfen und weiterentwickelt, der Begriff kam aber in erster Linie im Zusammenhang mit IBM-PCs und kompatiblen Plattformen auf. Die relevanten Tabellen unter MS-DOS, später Microsoft Windows sind Codeseite 437 und Codeseite 1252. Für die Eingabeaufforderung einer deutschen Windows-Version wird standardmäßig Codeseite 850 verwendet.
Während für komplexere Dateiformate, etwa von Textverarbeitungsprogrammen, bei HTML oder XML, die Zeichenkodierung entweder einem festen Standard entspricht oder im Dokument selbst angegeben ist, fehlt diese Information bei einfachen Textdateien. Auch für die korrekte Anzeige von Dateinamen kann eine passende Zeichensatztabelle nötig sein.
Je nach Betriebssystemversion und Einstellung der Eingabeaufforderung (Kommandozeile) kann auf jedem Rechner eine unterschiedliche Zeichensatztabelle aktiv sein. Hieraus resultiert, dass deutsche Texte mit Umlauten oder Eszett in Textdateien auf ausländischen Computern – oder auch schon beim Übergang von MS-DOS auf Microsoft Windows – oft nicht richtig dargestellt werden können. Die Ursache sind in der Zeichentabelle fehlende Umlaute oder die unterschiedliche Zuordnung der Umlaute unter anderen Zeichennummern.
Die Änderung der Zeichensatztabelle in einer Eingabeaufforderung (unter MS Windows etwa mit dem Befehl chcp) wirkt nur auf diese Eingabeaufforderung und die in deren Fenster laufenden Programme, nicht aber auf andere Programme, die im System ausgeführt werden.
Siehe auch
Einzelnachweise
- ↑ Microsoft: Microsoft MS-DOS 6.2, Überschrift Seite 261: Zeichensatztabellen (Codeseitentabellen); in der Onlinehilfe von Microsoft Windows 2000 und höher wird der deutsche Begriff nicht mehr verwendet, allerdings noch das Systemprogramm Zeichentabelle zur Verwendung von Sonderzeichen beschrieben; unter den Regions- und Sprachoptionen lassen sich Codepagekonvertierungstabellen installieren
Wikimedia Foundation.