- Codepage
-
Eine Codepage ist eine Tabelle mit einer Zeichenkodierung verschiedener Zeichen, traditionell geprägt von IBM. Apple verwendet für den Macintosh den gleichbedeutenden Begriff Character Map. Im Deutschen nutzt man eher das englische Original, da es keine allgemein anerkannte deutsche Übersetzung gibt. Als Alternativen bieten sich jedoch die Begriffe Zeichentabelle oder Zeichensatztabelle an. Auf Computern dargestellte Zeichen werden bei der Programmierung entsprechend einer Tabelle codiert, daher rührt der eigentliche Name. Für die Codierung gibt es normalerweise 256 Zeichen, die in einer Tabelle von 0 bis 255 dargestellt sind. Der Wert ergibt sich aus dem zur Verfügung stehenden Oktett (acht Bit): 28 = 256. Die erste Hälfte (Zeichen 1 bis 126) ist dabei in fast allen Codepages identisch mit ASCII – ausgenommen sind die EBCDIC-Codepages von IBM-Großrechnern. Vereinzelt gibt es Codepages mit mehr als 8 Bits pro Zeichen, insgesamt resultieren daraus dann mehr als 256 Zeichen.
Zu unterscheiden sind die hier abgehandelten Codepages nach Industriestandards und nach nationalen und internationalen Normen. Zu Letzterem siehe ISO 8859. In Unicode finden alle Zeichen gebräuchlicher Codepages eine Eins-zu-Eins-Entsprechung.
IBM hat viele verschiedene Codepages entworfen und weiterentwickelt, der Begriff kam aber in erster Linie im Zusammenhang mit IBM-PCs und kompatiblen Plattformen auf. Die relevanten Tabellen unter MS-DOS bzw. Microsoft Windows sind Codepage 437 bzw. Codepage 1252. Für die Eingabeaufforderung einer deutschen Windows-Version wird standardmäßig Codepage 850 verwendet.
Während für komplexere Dateiformate, etwa von Textverarbeitungsprogrammen, bei HTML oder XML, die Zeichenkodierung entweder einem festen Standard entspricht oder im Dokument selbst angegeben ist, fehlt diese Information bei einfachen Textdateien. Auch für die korrekte Anzeige von Dateinamen kann eine passende Codepage nötig sein.
Je nach Betriebssystemversion und Einstellung der Eingabeaufforderung (Kommandozeile) kann auf jedem Rechner eine unterschiedliche Codepage aktiv sein. Hieraus resultiert, dass deutsche Texte mit Umlauten oder Eszett in Textdateien auf ausländischen Computern – oder auch schon beim Übergang von MS-DOS auf Microsoft Windows – oft nicht richtig dargestellt werden können. Die Ursache sind in der Zeichentabelle fehlende Umlaute oder die unterschiedliche Zuordnung der Umlaute unter anderen Zeichennummern.
Die Änderung der Codepage in einer Eingabeaufforderung (unter MS Windows etwa mit dem Befehl chcp) wirkt nur auf diese Eingabeaufforderung und die in deren Fenster laufenden Programme, nicht aber auf andere Programme, die im System ausgeführt werden.
Wikimedia Foundation.