Base85

Base85: Unter der Bezeichnung Base85 werden verschiedene, zu einander inkompatible Kodierungsverfahren zusammengefasst, die 8-bit-Binärdaten in eine Folge von druckbaren ASCII-Zeichen umwandelt. Sie haben gemeinsam, dass sie Blöcke von jeweils vier Bytes in fünf ASCII-Zeichen kodieren. Hierfür sind mindestens 85 verschiedene Zeichen nötig, was diesem Verfahren seinen Namen gab. Der Vorteil ist der mit 25 % etwas geringere Kodierungsoverhead, im Vergleich zu 33 %, der bei der standardisierten Base64-Kodierung auftritt.

Die größte Verbreitung hat diese Kodierung im PostScript-Dateiformat von Adobe, diese Kodierungsversion wird auch Ascii85 genannt.

Inhaltsverzeichnis

1 Grundidee

2 PostScript

3 IPv6 Adressenkodierung nach RFC 1924

4 Sonstige Verwendung

5 Weblinks

6 Siehe auch

Grundidee

Vier Bytes können 256⁴ = 4.294.967.296 verschiedene mögliche Zustände annehmen. Um diese mit möglichst geringem Overhead zu kodieren, wählt man eine geeignete Teilmenge aus den druckbaren ASCII-Zeichen aus, die es ermöglicht, mit 5 Zeichen auszukommen. Hierfür ist ein Alphabet von mindestens 85 Zeichen nötig, da 85⁵ = 4.437.053.125 ≥ 4.294.967.296 ist. (84 Zeichen reichen nicht, denn 84⁵ = 4.182.119.424 < 4.294.967.296).

Wenn die vier Bytes mit $b 1, b 2, b 3$ und $b 4$ bezeichnet werden, und die fünf kodierten Zeichen $c 1,..., c 5$ , so ergibt sich folgende Umrechnungsformel:

$(b_1\cdot256^3) + (b_2\cdot 256^2) + (b_3 \cdot 256) + b_4 = (c_1 \cdot 85^4) + (c_2 \cdot 85^3) + (c_3 \cdot 85^2) + (c_4 \cdot 85) + c_5$

Mit anderen Worten: Die vier Bytes werden als vierstellige Zahl zur Basis 256 aufgefasst und in eine fünfstellige Zahl zur Basis 85 umgewandelt.

Die Codes $c 1 ... c 5$ werden nun durch bestimmte druckbare ASCII-Zeichen repräsentiert.

PostScript

Die Base85-Kodierung in PostScript addiert auf die Werte $c 1 ... c 5$ den Wert 33 und benutzt somit die ASCII-Werte 33 bis 117, welche den ASCII-Zeichen "!" bis "u" entsprechen. Einzige Ausnahme dabei: vier aufeinander folgende Nullbytes werden nicht durch "!!!!!" kodiert, sondern mit einem einzelnen "z". Durch diese einfache Art der Datenkomprimierung wird der Kodierungsoverhead von Base85 je nach Dateninhalt verringert oder sogar kompensiert, zumal insbesondere bei in PostScript eingebetteten Rastergrafiken längere Folgen von Nullbytes recht häufig vorkommen können.
Bei der Kodierung können nach Belieben Leerzeichen und Zeilenumbrüche eingefügt werden, etwa um eine bestimmte maximale Zeilenlänge zu erreichen. Diese Zeichen werden bei der Dekodierung ignoriert. Alle anderen Zeichen stellen einen Fehler dar, worauf die Dekodierung abbricht.

IPv6 Adressenkodierung nach RFC 1924

Eine etwas andere Kodierung wurde im RFC 1924 für IPv6-Adressen vorgeschlagen (Man beachte den Tag der Veröffentlichung dieses RFCs). Die zu kodierende 128-bit-IPv6-Adresse wird nicht in vier Blöcke zu je 32 Bit zerteilt, sondern als eine 128-Bit-Zahl aufgefasst. Diese wird sukzessive durch 85 geteilt, die dabei auftretenden Reste sind die „Ziffern“ der Base85-Kodierung.

Jede IPv6-Adresse lässt sich so in 20 Zahlen aus dem Bereich 0…84 kodieren. Die Zuordnung dieser Zahlen zu ASCII-Zeichen erfolgt über eine Look-up-Tabelle, da man bei der Kodierung bestimmte ASCII-Zeichen, die „in bestimmten Umgebungen problematisch sein könnten“, vermeiden wollte. Die verwendete Look-up-Tabelle ist wie folgt:

Wert Zeichen Wert Zeichen Wert Zeichen Wert Zeichen Wert Zeichen

0 0 17 H 34 Y 51 p 68 )

1 1 18 I 35 Z 52 q 69 *

2 2 19 J 36 a 53 r 70 +

3 3 20 K 37 b 54 s 71 -

4 4 21 L 38 c 55 t 72 ;

5 5 22 M 39 d 56 u 73 <

6 6 23 N 40 e 57 v 74 =

7 7 24 O 41 f 58 w 75 >

8 8 25 P 42 g 59 x 76 ?

9 9 26 Q 43 h 60 y 77 @

10 A 27 R 44 i 61 z 78 ^

11 B 28 S 45 j 62 ! 79 _

12 C 29 T 46 k 63 # 80 `

13 D 30 U 47 l 64 $ 81 {

14 E 31 V 48 m 65 % 82 |

15 F 32 W 49 n 66 & 83 }

16 G 33 X 50 o 67 ( 84 ~

Nicht verwendet werden die ASCII-Zeichen: " ' , . / : [ \ ] sowie das Leerzeichen und die 33 Steuerzeichen.

Sonstige Verwendung

Trotz des etwas geringeren Overheads hat sich die Base85-Kodierung – außer in Spezialgebieten – nicht durchsetzen können. Mittlerweile existiert mit basE91 ein noch effizienteres Verfahren. Für die ASCII-Kodierung von Binärdaten in E-Mails und Usenet-Artikeln ist nur die Base64-Kodierung nach dem MIME-Standard vorgesehen.

Weblinks

Online De- und Encoder

Siehe auch

Base32

Base64

Kategorien:
Datenformat
Zeichenkodierung

Wert	Zeichen		Wert	Zeichen		Wert	Zeichen		Wert	Zeichen	Wert	Zeichen
0	0	17	H	34	Y	51	p	68	)
1	1	18	I	35	Z	52	q	69	*
2	2	19	J	36	a	53	r	70	+
3	3	20	K	37	b	54	s	71	-
4	4	21	L	38	c	55	t	72	;
5	5	22	M	39	d	56	u	73	<
6	6	23	N	40	e	57	v	74	=
7	7	24	O	41	f	58	w	75	>
8	8	25	P	42	g	59	x	76	?
9	9	26	Q	43	h	60	y	77	@
10	A	27	R	44	i	61	z	78	^
11	B	28	S	45	j	62	!	79	_
12	C	29	T	46	k	63	#	80	`
13	D	30	U	47	l	64	$	81	{
14	E	31	V	48	m	65	%	82	\|
15	F	32	W	49	n	66	&	83	}
16	G	33	X	50	o	67	(	84	~

Игры ⚽ Нужна курсовая?

Schlagen Sie auch in anderen Wörterbüchern nach:

Base 64 — Base64 ist ein Begriff aus dem Computerbereich und beschreibt ein Verfahren zur Kodierung von 8 Bit Binärdaten (z. B. ausführbare Programme, ZIP Dateien), in eine Zeichenfolge, die nur aus wenigen, Codepage unabhängigen ASCII Zeichen besteht. Im… … Deutsch Wikipedia
Binaries — Eine Binärdatei (engl. binary file) ist eine Datei, die im Unterschied zu einer reinen Textdatei auch nicht alphabetische Zeichen enthält. Es kann somit jeder beliebige Bytewert vorkommen. Dateien im Binärformat werden im Allgemeinen eher dazu… … Deutsch Wikipedia
Binärformat — Eine Binärdatei (engl. binary file) ist eine Datei, die im Unterschied zu einer reinen Textdatei auch nicht alphabetische Zeichen enthält. Es kann somit jeder beliebige Bytewert vorkommen. Dateien im Binärformat werden im Allgemeinen eher dazu… … Deutsch Wikipedia
Radix-64 — Base64 ist ein Begriff aus dem Computerbereich und beschreibt ein Verfahren zur Kodierung von 8 Bit Binärdaten (z. B. ausführbare Programme, ZIP Dateien), in eine Zeichenfolge, die nur aus wenigen, Codepage unabhängigen ASCII Zeichen besteht. Im… … Deutsch Wikipedia
ASCII85 — (Также известный как «Base85») это форма кодирования двоичных данных при помощи текста, разработанная Полом Раттером (Paul E. Rutter) для библиотеки btoa. Благодаря тому, что для кодирования 4 байт данных используется 5 ASCII символов… … Википедия
85 (number) — 85 (eighty five) is the natural number following 84 and preceding 86. ← 84 86 → 85 ← 80 … Wikipedia
Ascii85 — (also called Base85 ) is a form of binary to text encoding developed by Paul E. Rutter for the btoa utility. By using five ASCII characters to represent four bytes of binary data (encoded size 25% larger), it is more efficient than uuencode or… … Wikipedia
Base32 — beschreibt ein Verfahren zur Kodierung von Binärdaten in eine Zeichenfolge, die nur aus 32 verschiedenen ASCII Zeichen besteht (plus einem zusätzlichen 33. Zeichen als Füllzeichen am Datenende). Angewendet wird es in Umgebungen, wo nicht zwischen … Deutsch Wikipedia
Base64 — ist ein Begriff aus dem Computerbereich und beschreibt ein Verfahren zur Kodierung von 8 Bit Binärdaten (z. B. ausführbare Programme, ZIP Dateien) in eine Zeichenfolge, die nur aus lesbaren Codepage unabhängigen ASCII Zeichen besteht. Im… … Deutsch Wikipedia
Binärdatei — Eine Binärdatei (engl. binary file) ist eine Datei, die im Unterschied zu einer reinen Textdatei auch nicht alphabetische Zeichen enthält. Es kann somit jeder beliebige Bytewert vorkommen. Dateien im Binärformat werden eher zur Speicherung von… … Deutsch Wikipedia

Academic dictionaries and encyclopedias

Base85

Inhaltsverzeichnis

Grundidee

PostScript

IPv6 Adressenkodierung nach RFC 1924

Sonstige Verwendung

Weblinks

Siehe auch

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Academic dictionaries and encyclopedias

Deutsch Wikipedia

Base85

Inhaltsverzeichnis

Grundidee

PostScript

IPv6 Adressenkodierung nach RFC 1924

Sonstige Verwendung

Weblinks

Siehe auch

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Direct link