EBCDIC

EBCDIC

Der Extended Binary Coded Decimals Interchange Code (EBCDIC, sinngemäß „erweiterter Austauschcode für binär kodierte Dezimalziffern“) ist eine von IBM entwickelte 8-Bit-Zeichenkodierung, bei der jedoch nicht alle Codewörter verwendet werden. Der EBCDIC ist aus dem älteren 4-Bit-Code BCD (Binary Coded Decimals) entstanden. Die Ziffern 0 bis 9 sind an Position F0h bis F9h (240 bis 249).

EBCDIC wird praktisch ausschließlich auf Großrechnern verwendet. Die EBCDIC-Codepage gibt es in diversen Varianten. EBCDIC ist neben ASCII und dessen Erweiterungen (einschließlich Unicode) der einzige Zeichensatz, der noch eine gewisse Verbreitung hat, aufgrund der historisch gewachsenen Marktdominanz der IBM 360-Serie.

Ähnlich wie das Unicode Transformation Format UTF-8 eine Kodierung von Unicode unter Beibehaltung der Kodierung des ASCII-Zeichensatzes darstellt, gibt es eine Unicode-Kodierung, die auf EBCDIC aufbaut. Dieses Format heißt UTF-EBCDIC.

Inhaltsverzeichnis

Übersicht: EBCDIC-Codepages mit Latin-1-Zeichensatz

Übersicht: EBCDIC-Codepages mit Latin-1-Zeichensatz
Länder
500 1148 International
037 1140 Australien, Brasilien, Kanada, Neuseeland, Portugal, Südafrika, USA
273 1141 Deutschland, Österreich
277 1142 Dänemark, Norwegen
278 1143 Finnland, Schweden
280 1144 Italien
284 1145 Lateinamerika, Spanien
285 1146 Großbritannien und Nordirland, Irland
297 1147 Frankreich
871 1149 Island
1047 Offene Systeme (MVS C-Compiler)
EDF03DRV Deutschland (BS2000/OSD)
1. Zahl (z. B. 500): EBCDIC-Codepage mit vollständigem Latin-1-Zeichensatz
2. Zahl (z. B. 1148): Dieselbe Codepage, jedoch ist das Währungszeichen ¤ durch das Eurozeichen € ersetzt worden

EBCDIC 500

EBCDIC 500 ist eine Variante des EBCDIC-Codes. Er wird zur Darstellung des internationalen Zeichensatzes verwendet, praktisch ausschließlich auf IBM-Großrechnern.

codepage 500
International
0 1 2 3 4 5 6 7 8 9 A B C D E F
4_ â ä à á ã å ç ñ [ . < ( +  ! 4_   (4 hex = 0100 bin)
5_ & é ê ë è í î ï ì ß ] $ * )  ; ^ 5_   (5 hex = 0101 bin)
6_ - / Â Ä À Á Ã Å Ç Ñ ¦ ,  % _ >  ? 6_   (6 hex = 0110 bin)
7_ ø É Ê Ë È Í Î Ï Ì `  : # @ ' = " 7_   (7 hex = 0111 bin)
8_ Ø a b c d e f g h i «   » ð ý þ ± 8_   (8 hex = 1000 bin)
9_ ° j k l m n o p q r ª º æ ¸ Æ ¤ 9_   (9 hex = 1001 bin)
A_ µ ~ s t u v w x y z ¡ ¿ Ð Ý Þ ® A_   (A hex = 1010 bin)
B_ ¢ £ ¥ · © § ¼ ½ ¾ ¬ ¯ ¨ ´ × B_   (B hex = 1011 bin)
C_ { A B C D E F G H I ­ ô ö ò ó C_   (C hex = 1100 bin)
D_ } J K L M N O P Q R ¹ û ü ù ú ÿ D_   (D hex = 1101 bin)
E_ \ ÷ S T U V W X Y Z ² Ô Ö Ò Ó Õ E_   (E hex = 1110 bin)
F_ 0 1 2 3 4 5 6 7 8 9 ³ Û Ü Ù Ú F_   (F hex = 1111 bin)
0 1 2 3 4 5 6 7 8 9 A B C D E F
  • 40: Leerzeichen
  • 41: geschütztes Leerzeichen
  • CA: weicher/kurzer Trennstrich
  • FF: Steuerzeichen (EBCDIC)

EBCDIC 273

EBCDIC 273 ist eine Variante des EBCDIC-Codes. Er wird zur Darstellung des Zeichensatzes der deutschen Sprache verwendet, praktisch ausschließlich auf IBM-Großrechnern.

codepage 273
Deutschland, Österreich
0 1 2 3 4 5 6 7 8 9 A B C D E F
4_ â { à á ã å ç ñ Ä . < ( +  ! 4_   (4 hex = 0100 bin)
5_ & é ê ë è í î ï ì ~ Ü $ * )  ; ^ 5_   (5 hex = 0101 bin)
6_ - / Â [ À Á Ã Å Ç Ñ ö ,  % _ >  ? 6_   (6 hex = 0110 bin)
7_ ø É Ê Ë È Í Î Ï Ì `  : # § ' = " 7_   (7 hex = 0111 bin)
8_ Ø a b c d e f g h i «   » ð ý þ ± 8_   (8 hex = 1000 bin)
9_ ° j k l m n o p q r ª º æ ¸ Æ ¤ 9_   (9 hex = 1001 bin)
A_ µ ß s t u v w x y z ¡ ¿ Ð Ý Þ ® A_   (A hex = 1010 bin)
B_ ¢ £ ¥ · © @ ¼ ½ ¾ ¬ ¯ ¨ ´ × B_   (B hex = 1011 bin)
C_ ä A B C D E F G H I ­ ô ¦ ò ó C_   (C hex = 1100 bin)
D_ ü J K L M N O P Q R ¹ û } ù ú ÿ D_   (D hex = 1101 bin)
E_ Ö ÷ S T U V W X Y Z ² Ô \ Ò Ó Õ E_   (E hex = 1110 bin)
F_ 0 1 2 3 4 5 6 7 8 9 ³ Û ] Ù Ú F_   (F hex = 1111 bin)
0 1 2 3 4 5 6 7 8 9 A B C D E F
  • 40: Leerzeichen
  • 41: geschütztes Leerzeichen
  • CA: weicher/kurzer Trennstrich
  • FF: Steuerzeichen (EBCDIC)

EBCDIC 037

EBCDIC 037 ist eine Variante des EBCDIC-Codes. Er wird (praktisch ausschließlich auf IBM-Großrechnern) zur Darstellung des Zeichensatzes der englischen und portugiesischen Sprachen verwendet.

codepage 037
Australien, Brasilien, Kanada, Neuseeland, Portugal, Südafrika, USA
0 1 2 3 4 5 6 7 8 9 A B C D E F
4_ â ä à á ã å ç ñ ¢ . < ( + 4_   (4 hex = 0100 bin)
5_ & é ê ë è í î ï ì ß  ! $ * )  ; ¬ 5_   (5 hex = 0101 bin)
6_ - / Â Ä À Á Ã Å Ç Ñ ¦ ,  % _ >  ? 6_   (6 hex = 0110 bin)
7_ ø É Ê Ë È Í Î Ï Ì `  : # @ ' = " 7_   (7 hex = 0111 bin)
8_ Ø a b c d e f g h i «   » ð ý þ ± 8_   (8 hex = 1000 bin)
9_ ° j k l m n o p q r ª º æ ¸ Æ ¤ 9_   (9 hex = 1001 bin)
A_ µ ~ s t u v w x y z ¡ ¿ Ð Ý Þ ® A_   (A hex = 1010 bin)
B_ ^ £ ¥ · © § ¼ ½ ¾ [ ] ¯ ¨ ´ × B_   (B hex = 1011 bin)
C_ { A B C D E F G H I ­ ô ö ò ó C_   (C hex = 1100 bin)
D_ } J K L M N O P Q R ¹ û ü ù ú ÿ D_   (D hex = 1101 bin)
E_ \ ÷ S T U V W X Y Z ² Ô Ö Ò Ó Õ E_   (E hex = 1110 bin)
F_ 0 1 2 3 4 5 6 7 8 9 ³ Û Ü Ù Ú F_   (F hex = 1111 bin)
0 1 2 3 4 5 6 7 8 9 A B C D E F
  • 40: Leerzeichen
  • 41: geschütztes Leerzeichen
  • CA: weicher/kurzer Trennstrich
  • FF: Steuerzeichen (EBCDIC)

EBCDIC 1140

EBCDIC 1140 ist eine Variante des EBCDIC-Codes. Er wird (praktisch ausschließlich auf IBM-Großrechnern) zur Darstellung des Zeichensatzes der englischen und portugiesischen Sprachen verwendet. Sie entspricht der Codepage 037 und unterscheidet sich von ihr nur in der Position 9F, wo sich statt des internationalen Währungssymbols ¤ das Eurozeichen € befindet.

codepage 1140
Australien, Brasilien, Kanada, Neuseeland, Portugal, Südafrika, USA
0 1 2 3 4 5 6 7 8 9 A B C D E F
4_ â ä à á ã å ç ñ ¢ . < ( + 4_   (4 hex = 0100 bin)
5_ & é ê ë è í î ï ì ß  ! $ * )  ; ¬ 5_   (5 hex = 0101 bin)
6_ - / Â Ä À Á Ã Å Ç Ñ ¦ ,  % _ >  ? 6_   (6 hex = 0110 bin)
7_ ø É Ê Ë È Í Î Ï Ì `  : # @ ' = " 7_   (7 hex = 0111 bin)
8_ Ø a b c d e f g h i «   » ð ý þ ± 8_   (8 hex = 1000 bin)
9_ ° j k l m n o p q r ª º æ ¸ Æ 9_   (9 hex = 1001 bin)
A_ µ ~ s t u v w x y z ¡ ¿ Ð Ý Þ ® A_   (A hex = 1010 bin)
B_ ^ £ ¥ · © § ¼ ½ ¾ [ ] ¯ ¨ ´ × B_   (B hex = 1011 bin)
C_ { A B C D E F G H I ­ ô ö ò ó C_   (C hex = 1100 bin)
D_ } J K L M N O P Q R ¹ û ü ù ú ÿ D_   (D hex = 1101 bin)
E_ \ ÷ S T U V W X Y Z ² Ô Ö Ò Ó Õ E_   (E hex = 1110 bin)
F_ 0 1 2 3 4 5 6 7 8 9 ³ Û Ü Ù Ú F_   (F hex = 1111 bin)
0 1 2 3 4 5 6 7 8 9 A B C D E F
  • 40: Leerzeichen
  • 41: geschütztes Leerzeichen
  • CA: weicher/kurzer Trennstrich
  • FF: Steuerzeichen (EBCDIC)

EBCDIC 1141

EBCDIC 1141 ist eine Variante des EBCDIC-Codes. Er wird zur Darstellung des Zeichensatzes der deutschen Sprache verwendet, praktisch ausschließlich auf IBM-Großrechnern. Sie entspricht der Codepage 273 und unterscheidet sich von ihr nur in der Position 9F, wo sich statt des internationalen Währungssymbols ¤ das Eurozeichen € befindet.

codepage 1141
Deutschland, Österreich
0 1 2 3 4 5 6 7 8 9 A B C D E F
4_ â { à á ã å ç ñ Ä . < ( +  ! 4_   (4 hex = 0100 bin)
5_ & é ê ë è í î ï ì ~ Ü $ * )  ; ^ 5_   (5 hex = 0101 bin)
6_ - / Â [ À Á Ã Å Ç Ñ ö ,  % _ >  ? 6_   (6 hex = 0110 bin)
7_ ø É Ê Ë È Í Î Ï Ì `  : # § ' = " 7_   (7 hex = 0111 bin)
8_ Ø a b c d e f g h i «   » ð ý þ ± 8_   (8 hex = 1000 bin)
9_ ° j k l m n o p q r ª º æ ¸ Æ 9_   (9 hex = 1001 bin)
A_ µ ß s t u v w x y z ¡ ¿ Ð Ý Þ ® A_   (A hex = 1010 bin)
B_ ¢ £ ¥ · © @ ¼ ½ ¾ ¬ ­ ¯ ¨ ´ × B_   (B hex = 1011 bin)
C_ ä A B C D E F G H I ­ ô ¦ ò ó õ C_   (C hex = 1100 bin)
D_ ü J K L M N O P Q R ¹ û } ù ú ÿ D_   (D hex = 1101 bin)
E_ Ö ÷ S T U V W X Y Z ² Ô \ Ò Ó Õ E_   (E hex = 1110 bin)
F_ 0 1 2 3 4 5 6 7 8 9 ³ Û ] Ù Ú F_   (F hex = 1111 bin)
0 1 2 3 4 5 6 7 8 9 A B C D E F
  • 40: Leerzeichen
  • 41: geschütztes Leerzeichen
  • BB: senkrechter Strich (Pipe)
  • CA: weicher/kurzer Trennstrich
  • FF: Steuerzeichen (EBCDIC)

EBCDIC 1148

EBCDIC 1148 ist eine Variante des EBCDIC-Codes. Er wird zur Darstellung des internationalen Zeichensatzes verwendet, praktisch ausschließlich auf IBM-Großrechnern. Sie entspricht der Codepage 500 und unterscheidet sich von ihr nur in der Position 9F, wo sich statt des internationalen Währungssymbols ¤ das Eurozeichen € befindet.

codepage 1148
International
0 1 2 3 4 5 6 7 8 9 A B C D E F
4_ â ä à á ã å ç ñ [ . < ( +  ! 4_   (4 hex = 0100 bin)
5_ & é ê ë è í î ï ì ß ] $ * )  ; ^ 5_   (5 hex = 0101 bin)
6_ - / Â Ä À Á Ã Å Ç Ñ ¦ ,  % _ >  ? 6_   (6 hex = 0110 bin)
7_ ø É Ê Ë È Í Î Ï Ì `  : # @ ' = " 7_   (7 hex = 0111 bin)
8_ Ø a b c d e f g h i «   » ð ý þ ± 8_   (8 hex = 1000 bin)
9_ ° j k l m n o p q r ª º æ ¸ Æ 9_   (9 hex = 1001 bin)
A_ µ ~ s t u v w x y z ¡ ¿ Ð Ý Þ ® A_   (A hex = 1010 bin)
B_ ¢ £ ¥ · © § ¼ ½ ¾ ¬ ¯ ¨ ´ × B_   (B hex = 1011 bin)
C_ { A B C D E F G H I ­ ô ö ò ó C_   (C hex = 1100 bin)
D_ } J K L M N O P Q R ¹ û ü ù ú ÿ D_   (D hex = 1101 bin)
E_ \ ÷ S T U V W X Y Z ² Ô Ö Ò Ó Õ E_   (E hex = 1110 bin)
F_ 0 1 2 3 4 5 6 7 8 9 ³ Û Ü Ù Ú F_   (F hex = 1111 bin)
0 1 2 3 4 5 6 7 8 9 A B C D E F
  • 40: Leerzeichen
  • 41: geschütztes Leerzeichen
  • CA: weicher/kurzer Trennstrich
  • FF: Steuerzeichen (EBCDIC)

EBCDIC.DF.03-DRV (CCSN:EDF03DRV)

EBCDIC.DF.03-DRV oder CCSN:EDF03DRV ist eine Variante des EBCDIC-Codes, die auf Siemens Großrechnern unter dem Betriebssystem BS2000/OSD zur Darstellung des deutschen Zeichensatzes verwendet wird. Diese Variante weicht speziell bei der Definition der deutschen Umlaute von anderen EBCDIC-Varianten ab.

EBCDIC.DF.03-DRV
Deutsch
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _D _E _F
4_ ` . < ( + ö 4_   (4 hex = 0100 bin)
5_ &  ! $ * )  ; 5_   (5 hex = 0101 bin)
6_ - / ^ ,  % _ >  ? 6_   (6 hex = 0110 bin)
7_  : # @ § ' = " 7_   (7 hex = 0111 bin)
8_ a b c d e f g h i 8_   (8 hex = 1000 bin)
9_ j k l m n o p q r 9_   (9 hex = 1001 bin)
A_ s t u v w x y z A_   (A hex = 1010 bin)
B_ [ Ä \ Ö ] Ü B_   (B hex = 1011 bin)
C_ A B C D E F G H I ­ C_   (C hex = 1100 bin)
D_ J K L M N O P Q R D_   (D hex = 1101 bin)
E_ S T U V W X Y Z E_   (E hex = 1110 bin)
F_ 0 1 2 3 4 5 6 7 8 9 { ä } ü ~ ß F_   (F hex = 1111 bin)
0 1 2 3 4 5 6 7 8 9 A B C D E F
  • 40: Leerzeichen

Eine weitere Besonderheit in diesem Zeichensatz ist die Doppelbelegung der Zeichen an den Positionen:

  • 0x4f = | oder ö
  • 0x7c = @ oder §
  • 0xbb = [ oder Ä
  • 0xbc = \ oder Ö
  • 0xbd = ] oder Ü
  • 0xfb = { oder Ä
  • 0xfd = } oder Ü
  • 0xff = ~ oder ß

Die Darstellung wird am BS200/OSD ausschließlich durch die verwendete Hardware bzw. durch die verwendeten Schriften unterschieden.

Steuerzeichen

Die ersten 64 Zeichen von 0016 bis 3F16 definieren Steuerzeichen und sind für alle EBCDIC-Codepages identisch.[1]

codepage 500
International
0 1 2 3 4 5 6 7 8 9 A B C D E F
0_ NUL SOH STX ETX SEL HT RNL DEL GE SPS RPT VT FF CR SO SI 0_   (016 = 00002)
1_ DLE DC1 DC2 DC3 RES
ENP
NL BS POC CAN EM UBS CU1 IFS IGS IRS IUS
ITB
1_   (116 = 00012)
2_ DS SOS FS WUS BYP
INP
LF ETB ESC SA SFE SM
SW
CSP MFA ENQ ACK BEL 2_   (216 = 00102)
3_ SYN IR PP TRN NBS EOT SBS IT RFF CU3 DC4 NAK SUB 3_   (316 = 00112)
0 1 2 3 4 5 6 7 8 9 A B C D E F

Einige Steuerzeichen haben ihre Bedeutung seit den frühen Versionen von EBCDIC geändert.

  • 0416 war in der ersten EBCDIC-Version von 1964 mit einem Zeichen namens „PF“ (Punch Off, „Lochung aus“) belegt.[2], später wurde daraus „ST“ (String Terminator, „Ende der Zeichenkette“)[2], und heute (2007) ist es mit „SEL“ (Select, „auswählen“) belegt[1], für das im ASCII-Code keine Entsprechung existiert.
  • 0616 ist heute (2007) mit „RNL“ (Required New Line, „benötigt neue Zeile“) belegt. Ursprünglich war es mit „LC“ (Lower Case, „Kleinbuchstaben“) belegt und zwischenzeitlich auch mit „SSA“ (System Status Available, „Systemstatus verfügbar“).
  • 0816 ist heute mit „GE“ (Graphic Escape, „Umschalten in den Grafikmodus“) belegt. Ursprünglich war es mit „EPA“ (End of Protected Area, „Ende des geschützten Bereichs“) belegt.
  • 0916 ist heute mit „SPS“ (Superscript, „Hochstellung“) belegt. Ursprünglich war es mit „RLF“ (Reverse Line Feed, „umgekehrter Zeilenvorschub“) belegt.
  • 0A16 ist heute mit „RPT“ (Repeat, „Wiederholen“) belegt. Ursprünglichen war es mit „SMM“ (Start of Manual Message, „Beginn einer händischen Mitteilung“) belegt.
  • 1316 ist heute mit „DC3“ (Device Control 3, „Gerätekontrollkode 3“) belegt. Ursprünglich war es mit „TM“ (Top Margin, „oberer Rand“) belegt.
  • 1416 ist heute mit „RES/ENP“ (Restore/Enable Presentation, „Darstellung wiederherstellen/aktivieren“) belegt. Zwischenzeitlich war es auch „OSC“ für Operating System Command („Betriebssystembefehl“) belegt.
  • 1716 ist heute mit „POC“ (Program-Operator Communication, „Kommunikation mit Programmbediener“) belegt. Ursprünglich war es „IL“ (Idle, „Leerlauf“) und zwischenzeitlich auch mit „ESA“ (End Selected Area, „Ende des ausgewählten Bereichs“) belegt.
  • 1A16 ist heute mit „UBS“ (Unit backspace, „eine Einheit zurück“) belegt. Ursprünglich war es mit „CC“ (Cursor Control, „Steuerung der Schreibmarke“) belegt.

Die Abkürzung „CU1“ steht für „Customer Use“, also ein frei nutzbares Steuerzeichen.

Die Steuerzeichen „IFS“ (Interchange File Separator), „IGS“ (Interchange Group Separator), „IRS“ (Interchange Record Separator) und „IUS“ (Interchange Unit Separator) sind Trennzeichen, die den ASCII-Steuerzeichen „FS“, „GS“, „RS“ und „US“ entsprechen. „ITB“ (Intermediate Transmission Block, „dazwischen liegender Sendeblock“) ist ein anderer Name für IUS.

Einzelnachweise

  1. a b Character Data Representation Architecture Reference: Appendix G. Control Character Mappings. IBM (online ; Stand: 13. August 2007). 
  2. a b Dik T. Winter: Standards on Codes. (online ; Stand: 13. August 2007). 

Weblinks


Wikimedia Foundation.

Игры ⚽ Поможем написать курсовую

Schlagen Sie auch in anderen Wörterbüchern nach:

  • EBCDIC — (англ. Extended Binary Coded Decimal Interchange Code  расширенный двоично десятичный код обмена информацией; произносится «эб си дик»)  стандартный восьмибитный код, разработанный корпорацией IBM для использования на мэйнфреймах… …   Википедия

  • EBCDIC — Extended Binary Coded Decimal Interchange Code EBCDIC es un código binario que representa caracteres alfanuméricos, controles y signos de puntuación. Cada carácter está compuesto por 8 bits = 1 byte, por eso EBCDIC define un total de 256 caracte …   Enciclopedia Universal

  • EBCDIC —   [Abk. für Extended Binary Coded Decimal Interchange Code, dt. »erweiterter binär kodierter dezimaler Datenaustausch Code«] der, erweiterte Form des BCD, der die binäre Darstellung von …   Universal-Lexikon

  • EBCDIC — ([e^]b s[e^]*d[i^]k ), n. [acronym from Extended Binary Coded Decimal Interchange Code.] (Computers) a 8 bit code for representing alphanumerical information in a digital information storage medium. It was used expecially on IBM mainframes, and… …   The Collaborative International Dictionary of English

  • EBCDIC — sigla ES ingl. Extended Binary Coded Decimal Interchange Code, codice binario per rappresentare informazioni alfanumeriche …   Dizionario italiano

  • EBCDIC — ☆ EBCDIC [eb′sə dik΄ ] n. a standard computer code for the alphanumeric representation of data …   English World dictionary

  • EBCDIC — Extended Binary Coded Decimal Interchange Code L Extended Binary Coded Decimal Interchange Code (EBCDIC) est un mode de codage des caractères sur 8 bits créé par IBM à l époque des cartes perforées. Il existe au moins 6 versions différentes bien… …   Wikipédia en Français

  • EBCDIC — Este artículo o sección necesita referencias que aparezcan en una publicación acreditada, como revistas especializadas, monografías, prensa diaria o páginas de Internet fidedignas. Puedes añadirlas así o avisar …   Wikipedia Español

  • Ebcdic 8859 — Les jeux de caractères EBCDIC existent en de nombreuses variantes nationales. Parmi celles ci on trouve les variantes étendues pour supporter de nombreux caractères du jeu de caractères latin n°1, et quelques autres adaptés pour chaque langue.… …   Wikipédia en Français

  • Ebcdic 297 — La page de code 297 est une variante de l’EBCDIC représentant complètement Latin 1 charset. Elle est utilisée pour le français. Page de code 297 EBCDIC (France) Hex ...0 ...1 ...2 ...3 ...4 ...5 ...6 ...7 ...8 ...9 ...A ...B ...C ...D ...E ...F… …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”