- Zeichensatz
-
Unter einem Zeichensatz versteht man einen Vorrat an Elementen (Zeichen) zur Darstellung von Sachverhalten. Solche Elemente können unter anderem die Buchstaben eines Alphabetes, Ziffern, aber auch andere Symbole sein, etwa die Sonderzeichen, die Zeichen der Lautumschrift des IPA-Codes oder der Brailleschrift, Piktogramme verschiedenster Art oder Steuerzeichen (unsichtbare Zeichen). Speziell in der Informationstechnik versteht man unter einem Zeichensatz die Gesamtheit der Zeichen einer bestimmten Zeichenkodierung und deren Zuordnung.
Die grafische Ausgestaltung eines Zeichens heißt Schriftzeichen, die des ganzen Zeichensatzes Schriftart bzw. Satz, die Regeln der Zeichensetzung Schriftsatz.
Inhaltsverzeichnis
Zeichensätze in wissenschaftlichen Formalismen
Typische Zeichensätze sind etwa:
- Einheitenzeichen der Einheiten von physikalischen Größen
- Formelzeichen und mathematische Symbole
Zeichensätze für Computersysteme
Traditionell in der Informatik bekannte Zeichenkodierungen sind der ASCII- und der EBCDIC-Code. Letzterer hat allerdings stark an Bedeutung verloren. Zunehmend in den Vordergrund getreten sind Zeichensätze mit international notwendigen Zeichen, die über das Englische hinausgehen, z. B. diesbezügliche Zeichensätze gemäß ANSI und insbesondere der international anerkannte Standard Unicode.
Name Einführung Bit Codepoints darstellbare Zeichen Normen erster Einsatz ASCII 1963 7 128 95 ANSI X3.4-1968 Fernschreiber Teletype ASR33 EBCDIC 1964 8 256 93 bis 192 IBM-Großrechner Unicode 1991 21 1.114.112 derzeit 100.000 (Unicode 5.1) ISO 10646 Xerox, Apple Die Zahl der darstellbaren Zeichen ist geringer als die Zahl der definierbaren Zeichen, da ein Teil des Zeichenvorrates als nicht-druckbare Steuerzeichen verwendet wird.
Den Teil der Computerhardware, der die Zeichen auf einem Bildschirm oder auch einem Plotter sichtbar werden lässt, nennt man Zeichengenerator.
Internationale Zeichensätze
- Unicode und ISO/IEC 10646 – Der internationale Standard, auf dem fast alle modernen Computer basieren (1991)
- ASCII – Einer der ältesten Computer-Zeichensätze (1963)
- ISO/IEC 8859-Familie – Mit 15 verschiedenen Zeichenkodierungen zur Abdeckung aller europäischen Sprachen sowie arabisch, hebräisch, thailändisch und türkisch (1986)
- ISO 646 – Definiert nationale ASCII-Varianten in 7 Bit-Kodierung (1972)
Zeichensätze von Computerfirmen
- EBCDIC, von IBM entwickelter Zeichensatz (1964)
- MacRoman, MacCyrillic und andere proprietäre Zeichensätze für Apple-Mac-Computer vor Mac OS X, welches Unicode verwendet
- PETSCII, der Zeichensatz der 8-Bit-Commodore-Computer
- Windows- und DOS-Codepages, z. B. Windows-1252 und MS-DOS Codepage 437, Codepage 850
- Windows Glyph List 4
Nationale Varianten
- ARMSCII – Armenisch
- Big5 – Zeichensatz für traditionelle chinesische Schriftzeichen (Taiwan, Auslandschinesen)
- DIN 66003 – Deutsch, nationale Variante von ISO 646 (1974)
- GEOSTD – Georgisch
- Guojia Biaozhun (GB) – Zeichensatz für vereinfachte chinesische Schriftzeichen
- HKSCS – Ein Standard aus Hong Kong für kantonesisch (1999)
- ISCII – Alle indischen Sprachen
- KOI8-R – Russisch
- KOI8-U – Ukrainisch
- TIS-620 – Thailändisch, ähnlich ISO 8859-11 (1990)
- TSCII – Tamil
- VISCII – Vietnamesisch
- Shift-JIS, auch SJIS – Japanisch, entworfen von Microsoft
- EUC (Extended UNIX Coding) – Mehrere ostasiatische Sprachen
Siehe auch: Normungsorganisation, Mojibake
Literatur
- Johannes Bergerhausen, Siri Poarangan: decodeunicode: Die Schriftzeichen der Welt Hermann Schmidt, Mainz, 2011, ISBN 978-3874398138
- The Unicode Consortium: The Unicode Standard, Version 6.0.0. The Unicode Consortium, Mountain View CA, 2011, ISBN 978-1-936213-01-6.
- Richard Gillam: Unicode Demystified, a practical programmer’s guide to the encoding standard. Addison Wesley, Boston MA 2003, ISBN 0-201-70052-2.
Weblinks
Commons: Zeichensätze – Sammlung von Bildern, Videos und Audiodateien- schoenitzer.de - Grundwissen und Umgang mit Encodings
- Joel Spolsky: The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!) 8. Oktober 2003
Wikimedia Foundation.