- CP437
-
MS-DOS-Codepages 437 Englisch 708 Arabisch (ASMO) 720 Arabisch (Microsoft) 737 Griechisch 775 Baltisch 850 Westeuropäisch 852 Mitteleuropäisch 855 Kyrillisch 857 Türkisch 858 Westeuropäisch mit Euro 860 Portugiesisch 861 Isländisch 862 Hebräisch 863 Kanadisches Französisch 864 Arabisch (IBM) 865 Nordisch 866 Russisch 869 Griechisch Die von PC DOS und MS-DOS verwendete Codepage 437, kurz CP437, auch bekannt als DOS-US oder OEM-US, ist der Original-Zeichensatz des IBM-PC ab 1981 und enthält folgende Zeichen: (Die Zahl unterhalb des Symbols ist der Unicode-Wert in hexadezimaler Schreibweise)
.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F 0. NULL
0☺
263A☻
263B♥
2665♦
2666♣
2663♠
2660•
2022◘
25D8○
25CB◙
25D9♂
2642♀
2640♪
266A♫
266B☼
263C1. ►
25BA◄
25C4↕
2195‼
203C¶
B6§
A7▬
25AC↨
21A8↑
2191↓
2193→
2192←
2190∟
221F↔
2194▲
25B2▼
25BC2.
20!
21"
22#
23$
24%
25&
26'
27(
28)
29*
2A+
2B,
2C-
2D.
2E/
2F3. 0
301
312
323
334
345
356
367
378
389
39:
3A;
3B<
3C=
3D>
3E?
3F4. @
40A
41B
42C
43D
44E
45F
46G
47H
48I
49J
4AK
4BL
4CM
4DN
4EO
4F5. P
50Q
51R
52S
53T
54U
55V
56W
57X
58Y
59Z
5A[
5B\
5C]
5D^
5E_
5F6. `
60a
61b
62c
63d
64e
65f
66g
67h
68i
69j
6Ak
6Bl
6Cm
6Dn
6Eo
6F7. p
70q
71r
72s
73t
74u
75v
76w
77x
78y
79z
7A{
7B|
7C}
7D~
7E⌂
23028. Ç
C7ü
FCé
E9â
E2ä
E4à
E0å
E5ç
E7ê
EAë
EBè
E8ï
EFî
EEì
ECÄ
C4Å
C59. É
C9æ
E6Æ
C6ô
F4ö
F6ò
F2û
FBù
F9ÿ
FFÖ
D6Ü
DC¢
A2£
A3¥
A5₧
20A7ƒ
192A. á
E1í
EDó
F3ú
FAñ
F1Ñ
D1ª
AAº
BA¿
BF⌐
2310¬
AC½
BD¼
BC¡
A1«
AB»
BBB. ░
2591▒
2592▓
2593│
2502┤
2524╡
2561╢
2562╖
2556╕
2555╣
2563║
2551╗
2557╝
255D╜
255C╛
255B┐
2510C. └
2514┴
2534┬
252C├
251C─
2500┼
253C╞
255E╟
255F╚
255A╔
2554╩
2569╦
2566╠
2560═
2550╬
256C╧
2567D. ╨
2568╤
2564╥
2565╙
2559╘
2558╒
2552╓
2553╫
256B╪
256A┘
2518┌
250C█
2588▄
2584▌
258C▐
2590▀
2580E. α
3B1ß
DFΓ
393π
3C0Σ
3A3σ
3C3µ
B5τ
3C4Φ
3A6Θ
398Ω
3A9δ
3B4∞
221Eφ
3C6ε
3B5∩
2229F. ≡
2261±
B1≥
2265≤
2264⌠
2320⌡
2321÷
F7≈
2248°
B0∙
2219·
B7√
221Aⁿ
207F²
B2■
25A0
A0Der Zeichensatz basiert auf ASCII, mit folgenden Änderungen und Ergänzungen:
- Dem C0-Steuerzeichenbereich (0x00–0x1F hex) sind Grafikzeichen zugeordnet. Die Codes können sowohl ihrer eigentlichen Funktion zur Steuerung dienen (Unter DOS erzeugt z. B. die Eingabe von echo Leertaste Strg+G Enter einen Pieps, und das sogar an der Eingabeaufforderung unter Windows XP und Vista) als auch auf dem Bildschirm angezeigt werden, zum Beispiel in einem Texteditor. Die Grafikzeichen sind sehr verschieden, vom Smiley über Spielkartenfarben zu Musiknoten. Auch Code 0x7F, DEL, zeigt eine Grafik – ein Haus.
- Dem hochbittigen Bereich, 0x80-0xFF, sind verschiedene Symbole zugeordnet: einige europäische Schriftzeichen (lateinische Vokale mit Akzenten usw.) ohne besondere Reihenfolge und unzureichend für die meisten europäischen Sprachen, des Weiteren Blockgrafikzeichen, mathematische Symbole und einige griechische Buchstaben, von denen das kleine Beta auch zugleich als deutsches ß herhalten muss.
- Der Bereich von 0xC0 bis 0xDF wurde ausschließlich für Grafikzeichen (Rahmenzeichen, engl: "box drawing characters") benutzt, da die MDA-Grafikkarten des ersten IBM PC (und später auch die VGA) diese Zeichen gesondert behandelten: Im Textmodus wird jedes Zeichen mit 9 Pixeln Breite dargestellt, da dies den Abstand zwischen den Zeichen und damit die Lesbarkeit erhöht. Die Zeichensätze enthalten jedoch nur 8 Pixel breite Zeichen. Die 9. Pixelspalte wird daher normalerweise einfach in der Hintergrundfarbe gezeichnet. Dies hätte bei den Rahmenzeichen jedoch unschöne Lücken zwischen den Zeichen zur Folge. Durch ein spezielles Register in der Grafikkarte lässt sich jedoch aktivieren, dass die 9. Pixelspalte durch Wiederholung der 8. Pixelspalte gewonnen wird. Dies wird aber nur für die Zeichen aus dem Bereich 0xC0 bis 0xDF angewendet. Aus diesem Grund sind alle Rahmenzeichen, die nach rechts weisende Verbindungslinien enthalten, in diesem Bereich angesiedelt worden.
Das Repertoire von CP437 wurde dem Zeichensatz der Wang-Textverarbeitungs-Maschinen entlehnt, was auch Bill Gates ausdrücklich in einem am 2. Oktober 1995 im Fortune Magazine erschienenen Interview von ihm und Paul Allen zugab:
- „... Auch waren wir fasziniert von den speziellen Textverarbeitungssystemen aus dem Hause Wang, denn wir glaubten, daß Allzweck-Maschinen diese Aufgaben genauso gut lösen könnten. Aus diesem Grund haben wir auch, als die Zeit kam, die Tastatur vom IBM-PC zu entwerfen, den lustigen Wang-Zeichensatz in die Maschine gepackt – Sie wissen schon, Smiley Faces und Kästchen und Dreiecke und so'n Zeugs. Wir dachten, wir würden eines Tages gern mal einen Klon der Wang-Textverarbeitungs-Software schreiben.“
Der Zeichenkodierung CP437 fehlen Zeichen, die für viele westeuropäische Sprachen nötig sind; so etwa akzentuierte Großbuchstaben für Französisch. Auch enthält sie nur wenige griechische Zeichen. Spätere MS-DOS-Zeichensätze, zum Beispiel Codepage 850 (DOS-Latin-1 und deren Euro-Variante Codepage 858), Codepage 852 (DOS Central-European) und Codepage 737 (DOS Greek), füllten die Lücken für internationale Nutzung, wobei sie insofern zu der Codepage 437 kompatibel blieben, als dass sie (außer einigen der Blockgrafikzeichen und mathematischen Symbolen) die meisten Zeichen beibehielten. Alle Zeichen aus CP437 sind heute im Unicode-Zeichensatz enthalten, sowie in Microsofts WGL4-Zeichensatz und somit auch in den meisten Schriftarten unter Microsoft Windows, und in dem VGA-Font unter Linux (und natürlich den ISO-10646-Fonts für X11).
CP437 verwendet für einige ähnlich aussehende Zeichen die gleiche Zuordnung: 0xE1 steht sowohl für das deutsche ß (U+00DF) als auch für das kleine β (U+03B2); der Apostroph 0x27 wird auch als Akut verwendet.
Weblinks
- MS-DOS Codepage 437 (US) V1.20 by Kosta Kostis
- ASCII-Schriftart Eine ASCII-Schrift für Windows in der Codepage 437
Wikimedia Foundation.