- Binaries
-
Eine Binärdatei (engl. binary file) ist eine Datei, die im Unterschied zu einer reinen Textdatei auch nicht-alphabetische Zeichen enthält. Es kann somit jeder beliebige Bytewert vorkommen. Dateien im Binärformat werden im Allgemeinen eher dazu verwendet, Daten abzuspeichern, als dass in ihnen Textdokumente gespeichert werden. Sie können auch nicht unbedingt mit einem üblichen Texteditor oder Text-Anzeigeprogramm eingesehen werden.
Inhaltsverzeichnis
Hintergrund
Grundsätzlich gelten alle Dateien als Binärdateien, wenn sie unlesbaren Text enthalten. Für die meisten der heute verwendeten 8-Bit-Zeichensätze gilt: nicht lesbare Steuerzeichen sind Zeichen mit ASCII-Werten von 0 bis 31 und lesbare Zeichen sind Zeichen mit Werten von 32 bis 126. Die Lesbarkeit von Zeichen mit Werten ab 127 ist abhängig vom verwendeten Zeichensatz. Beispielsweise beim File Transfer Protocol wird dennoch anhand deren Verwendung zwischen Binär- und Textdateien unterschieden.
Binärformate lassen sich meist schneller lesen und speichern als Textdateien und benötigen weniger Speicherplatz auf Massenspeichern. Ferner lassen sich darin verschiedene Objekttypen (beispielsweise Text mit Bildern) relativ einfach ablegen. Ferner werden Binärformate beim Austausch über verschiedene Plattformen hinweg (beispielsweise Windows, Macintosh, Linux) nicht beschädigt, da die jeweiligen Softwarekomponenten nicht versuchen, die Dateien für die Zielplattform zu konvertieren. Die Spezifikation des Dateiformats einer Binärdatei zeigt eindeutig, wie mit der Datei zu verfahren ist.
Jedoch benötigt man zum Lesen, Bearbeiten und Speichern binärer Datenformate spezielle Editoren, womit man sich oft in die Abhängigkeit von einem Softwarehersteller (und dessen unterstützten Plattformen) begibt. Insbesondere wenn das Dokumentenformat (wie etwa beim .doc-Format von Microsoft Word der Fall) proprietär und somit geistiges Eigentum einer Firma ist, das aus wirtschaftlichen Interessen (Kundenbindung) nicht offen ist (also unbekannt ist, wie diese Formate intern aufgebaut sind, oder der interne Aufbau wird zusätzlich durch Softwarepatente geschützt), lassen sich Informationen aus beschädigten Binärdateien, die die Originalapplikation nicht mehr öffnen kann, kaum mehr restaurieren. Damit eignen sich Binärformate nur bedingt zur Archivierung von Datenbeständen, es sei denn, das Format ist allgemein gebräuchlich (wie die frei verfügbaren binären Bildformate JFIF oder PNG). Auch müssen ältere Dokumente, wenn diese lesbar bleiben sollen, bei einer Software-Aktualisierung mitunter auf die neue Version des Formates konvertiert werden.
Beispiele
Computerprogramme sind ein typisches Beispiel für Binärdateien, denn sie enthalten CPU-Befehle und Daten, die jeden beliebigen Bytewert annehmen können. Aus diesem Grund nennt man die ausführbaren Dateien von kompilierten Programmen oft einfach Binaries. Im Gegensatz dazu ist der Quelltext als lesbare Textdatei abgespeichert.
Weitere Beispiele für Binärdateien sind Grafikdateien, Audiodateien und komprimierte Dateien (Archivdateien), also jeder Dateiinhalt außer Text.
Binärdatei in Text umwandeln
Binärdateien werden gelegentlich auch in einer Nur-Text-Repräsentation kodiert, um Störungen während einer Übertragung zwischen verschiedenen Computersystemen zu vermeiden. Man verwendet dazu Codierschemata wie Base64 (oder ähnliche, wie die kaum verbreiteten Base85 oder basE91) sowie UUE- und MIME-Formate.
Binärdateien anschauen
Um den unverfälschten Inhalt einer Binärdatei anzusehen, ist zusätzliche Software erforderlich. Für diese Aufgabe werden Hex-Editoren verwendet. Wird hingegen versucht, eine Binärdatei mit einem Texteditor oder auf der Konsole anzuschauen, dann wird der Inhalt verfälscht dargestellt (siehe Bild). Das rührt daher, dass bestimmte Bytes oder ganze Bytefolgen als Steuerzeichen bzw. Steuersequenzen interpretiert werden. Dies äußert sich in den meisten Fällen in einem Konzert aus häufigem Piepsen (etwa beim Bell-Steuerzeichen), Zeichensalat oder auch gar keiner Ausgabe. Der Grund dafür ist, dass in Binärdateien häufig alle möglichen 256 Zustände eines Bytes anzutreffen sind.
Nützliche Werkzeuge zum Betrachten des Inhaltes von Binärdateien unter Unix und Linux sind od (Abkürzung für englisch octal dump – oktales Speicherabbild), hexdump (für hexadecimal dump) oder strings.
Wie die acht Bit eines Bytes verwendet werden, um Dezimalzahlen oder Hexadezimalzahlen darzustellen, ist unter Dualsystem beschrieben.
Siehe auch
Wikimedia Foundation.