Radix-64

Radix-64

Base64 ist ein Begriff aus dem Computerbereich und beschreibt ein Verfahren zur Kodierung von 8-Bit-Binärdaten (z. B. ausführbare Programme, ZIP-Dateien), in eine Zeichenfolge, die nur aus wenigen, Codepage-unabhängigen ASCII-Zeichen besteht. Im Zusammenhang mit OpenPGP wird noch eine Prüfsumme (CRC-24) angehängt, dieses leicht modifizierte Verfahren trägt den Namen Radix-64.

Es findet im Internet-Standard MIME (Multipurpose Internet Mail Extensions) Anwendung und wird damit hauptsächlich zum Versenden von E-Mail-Anhängen verwendet. Nötig ist dies, um den problemlosen Transport von beliebigen Binärdaten zu gewährleisten, da SMTP in seiner ursprünglichen Fassung nur für den Versand von 7-Bit-ASCII-Zeichen ausgelegt war. Durch die Kodierung steigt der Platzbedarf des Datenstroms um 36 % (33 % durch die Kodierung selbst, weitere 3 % durch die im kodierten Datenstrom eingefügten Zeilenumbrüche).

Zur Kodierung werden die Zeichen AZ, az, 09, + und / verwendet, sowie = am Ende. Da diese Zeichen auch in EBCDIC (Extended Binary Coded Decimals Interchange Code) vorkommen (wenn auch an anderen Code-Positionen), ist damit auch ein Datenaustausch zwischen nicht-ASCII-Plattformen möglich.

Kodierung von Base64

Zur Kodierung werden jeweils drei Byte des Bytestroms (=24 bit) in vier 6-bit-Blöcke aufgeteilt. Jeder dieser 6-bit-Blöcke bildet eine Zahl zwischen 0 und 63. Diese Zahlen werden anhand der nachfolgenden Umsetzungstabelle in „druckbare ASCII-Zeichen“ umgewandelt und ausgegeben. Der Name des Algorithmus erklärt sich durch eben diesen Umstand – jedem Zeichen des kodierten Datenstroms lässt sich eine Zahl zwischen 0 und 63 zuordnen (siehe Tabelle). Mathematisch betrachtet gleicht dies einem Stellenwertsystem der Basis 64. In der Regel wird spätestens nach jeweils 76 ausgegebenen Zeichen ein Zeilenumbruch eingefügt, welcher jedoch ansonsten für die Kodierung nicht von Belang ist.

Falls die Gesamtanzahl der Eingabebytes nicht durch drei teilbar ist, wird der zu kodierende Text am Ende mit aus Nullbits bestehenden Füllbytes aufgefüllt, so dass sich eine durch drei teilbare Anzahl an Bytes ergibt. Um dem Dekodierer mitzuteilen, wie viele Füllbytes angefügt wurden, werden die 6-Bit-Blöcke, die vollständig aus Füllbytes entstanden sind, mit = kodiert. Somit können am Ende einer Base64-kodierten Datei null, ein oder zwei =-Zeichen auftreten. Anders gesagt (denn dies ist äquivalent), es werden so viele =-Zeichen angehängt, wie Füllbytes angefügt worden sind.

Wert Zeichen Wert Zeichen Wert Zeichen Wert Zeichen
0 A 16 Q 32 g 48 w
1 B 17 R 33 h 49 x
2 C 18 S 34 i 50 y
3 D 19 T 35 j 51 z
4 E 20 U 36 k 52 0
5 F 21 V 37 l 53 1
6 G 22 W 38 m 54 2
7 H 23 X 39 n 55 3
8 I 24 Y 40 o 56 4
9 J 25 Z 41 p 57 5
10 K 26 a 42 q 58 6
11 L 27 b 43 r 59 7
12 M 28 c 44 s 60 8
13 N 29 d 45 t 61 9
14 O 30 e 46 u 62 +
15 P 31 f 47 v 63 /

RFC 3548 beschreibt ebenfalls diese Kodierung, schlägt allerdings eine leicht modifizierte Variante vor, welche benutzt werden soll, falls die Zeichen + und / nicht angewendet werden können. (Zum Beispiel bei Dateinamen oder anderen Umgebungen, wo diese Zeichen eine Sonderbedeutung haben.) Diese Zeichen werden durch - (Minus, ASCII 2Dhex) und _ (Unterstrich, ASCII 5Fhex) ersetzt.

Beispiel

Polyfon zwitschernd aßen Mäxchens Vögel Rüben, Joghurt und Quark

Der UTF-8-kodierte Text wird Base64-kodiert zu:

UG9seWZvbiB6d2l0c2NoZXJuZCBhw59lbiBNw6R4Y2hlbnMgVsO2Z2VsIFLDvGJlbiwgSm9n
aHVydCB1bmQgUXVhcms=

Erkennbar ist hierbei, dass Base64 eine nicht lesbare Kodierung erstellt, im Gegensatz dazu ist ein quoted-printable-kodierter Text mit Ausnahme der Sonderzeichen zumindest teilweise lesbar.

Siehe auch

Weblinks


Wikimedia Foundation.

Игры ⚽ Нужно решить контрольную?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • RADIX-50 — (prononcer radix five zero) est un codage de caractères créé par DEC pour les ordinateurs de la série PDP, le DECsystem 10 et le DECSYSTEM 20. Le répertoire RADIX 50 comporte 40 caractères. Le nom RADIX 50 signifie « base 40 » :… …   Wikipédia en Français

  • Radix-50 — est un codage de caractère crée par DEC pour les ordinateurs de la série PDP, le DECsystem 10 et le DECSYSTEM 20. Le répertoire RADIX 50 comporte 40 caractères. Le nom RADIX 50 signifie « base 40 » : radix désigne une base en… …   Wikipédia en Français

  • Radix — (lat.: Wurzel) steht für: Radix das Ergebnis des Radizierens, (Wurzelziehens) in der Mathematik Radix (Gattung), eine Gattung der Schlammschnecken Radix (Studio), der Name eines japanischen Anime Studios (Radix oder Basis:) die Anzahl der Symbole …   Deutsch Wikipedia

  • Radix — Ra dix (r[=a] d[i^]ks), n.; pl. L. {Radices} (r[a^]d [i^]*s[=e]z), E. {Radixes} (r[=a] d[i^]ks*[e^]z). [L. radix, icis, root. See {Radish}.] 1. (Philol.) A primitive word, from which spring other words; a radical; a root; an etymon. [1913… …   The Collaborative International Dictionary of English

  • RADIX-50 — RADIX 50, commonly called Rad 50 or RAD50, is a character encoding created by Digital Equipment Corporation for use on their DECsystem, PDP, and VAX computers. RADIX 50 s 40 character repertoire (050 in octal) allows up to 3 characters to be… …   Wikipedia

  • radix — RÁDIX s.n. (Rar) Rădăcină. [< lat. radix]. Trimis de LauraGellner, 13.08.2005. Sursa: DN …   Dicționar Român

  • RADIX-50 — символьный код который позволяет записать в одном 16 битном слове три символа. Использовался в основном на миникомпьютерах, в первую очередь, семейства PDP 11 (СМ ЭВМ), для хранения имён файлов в файловых системах ОС RT 11 и RSX 11, имён модулей… …   Википедия

  • Radix — (lat.), 1) Wurzel; so R. armoraciae, Meerrettig. R. asări, Haselwurzel. R. irĕos florentinae, Veilchenwurzel. R. hellebŏri, Nieswurzel. R. squillae, Meerzwiebel. R. toxicaria, die Wurzel vom Upasbaum. R. zedoariae, Zittwerwurzel etc. 2) (Anat.),… …   Pierer's Universal-Lexikon

  • Radix — Radix, Wurzel; R. Alcannae, Alkannawurzel; R. Althaeae, Althee , Eibischwurzel; R. Angelicae, Archangelicae, Angelika , Engelwurzel; R. Artemisiae, Beifußwurzel; R. Asari, Haselwurzel; R. Bardanae, Klettenwurzel; R. Belladonnae, Belladonnawurzel; …   Meyers Großes Konversations-Lexikon

  • Radix — Radix, lat., Wurzel; Wurzelzahl; Wurzelform …   Herders Conversations-Lexikon

  • radix — Véase raíz. Diccionario Mosby Medicina, Enfermería y Ciencias de la Salud, Ediciones Hancourt, S.A. 1999 …   Diccionario médico

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”