- Magic Byte
-
Eine Magische Zahl (engl. magic number) ist in der Programmierung ein spezieller Wert, der für einen bestimmten Zweck, beispielsweise für die Kennzeichnung von Dateiformaten am Dateibeginn, genutzt wird.
Magische Zahlen werden meistens ausgewählt aus:
- ASCII (meistverwendet)
- hexadezimale Repräsentation von Zahlen (beispielsweise 305419896 = 0x12345678)
- Manchmal wird Hexspeak verwendet
Inhaltsverzeichnis
Magische Zahlen zur Kennzeichnung von Dateitypen
Eine frühe Konvention in unixartigen Betriebssystemen war, dass Binaries mit zwei Bytes anfingen, die eine „Magische Zahl“ einhielten, die den Typ der Datei angibt. Am Anfang wurden damit Objektdateien für verschiedene Plattformen gekennzeichnet. Nach und nach wurde dieses Konzept auch auf andere Dateien übertragen, und mittlerweile findet sich in fast jeder Binärdatei eine magische Zahl.
Viele andere Typen von Dateien haben einen Inhalt, der den Dateitypen identifiziert. So fängt XML mit den speziellen Zeichen <?xml an, der die Datei einwandfrei als XML kennzeichnet. Wandelt man diesen Dateianfang in eine Zahl um, kann man anhand eines einfachen Vergleiches schnell den Dateityp bestimmen, ohne viel über das Format wissen zu müssen.
Einige Beispiele:
- Die Stelle mit wichtigen Netzwerkparameter des BOOTP/DHCP beginnen mit einem "Magical Cookie" 0x63825363.
- kompilierte Java-Klassendateien (Bytecode) beginnen mit 0xCAFEBABE.
- GIF-Bilddateien enthalten am Anfang den ASCII-Code für ‚GIF89a‘ (0x474946383961) oder ‚GIF87a‘ (0x474946383761)
- JPEG/JFIF-Bilddateien fangen mit 0xFFD8FF an und enthalten weiterhin den ASCII-Code für ‚JFIF‘ (0x4A464946).
- PNG-Bilddateien beginnen mit einer 8-Byte-Signatur, die die Datei als PNG identifiziert und eine Erkennung von Dateiübertragungsproblemen ermöglicht: \211 P N G \r \n \032 \n (0x89504e470d0a1a0a)
- Standard-MIDI-Dateien enthalten den ASCII-Code für ‚MThd‘ (0x4D546864) gefolgt von Metadaten.
- Scripte aller Art starten normalerweise mit einem Shebang, ‚#!‘ (0x23 0x21), gefolgt von einem Pfad zum Interpreter (z.B. ,#!/usr/bin/perl‘ für Perl)
- Alte MS-DOS-exe-Dateien und neuere Microsoft-Windows-PE-exe-Dateien (Portable Executable) starten mit dem ASCII-Code ‚MZ‘ (0x4D5A) bzw. selten auch ‚ZM‘ (0x5A4D), die Initialen des Erfinders dieses Formats, Mark Zbikowski.
- Der Berkeley Fast File System Superblock wird identifiziert durch 0x19540119 oder 0x011954 je nach Version; beides ist das Geburtsdatum des Designers Marshall Kirk McKusick.
- Programme für den Game Boy und Game Boy Advance haben eine 48 oder 156 Byte lange magische Zahl. Diese Zahl enkodiert ein Bitmap des Nintendo-Logos.
- Alte Fat Binaries (die Code für sowohl den 68K- als auch den PowerPC-Prozessor enthalten) auf Mac OS 9 beginnen mit dem ASCII-Code von ‚Joy!‘ (engl. Freude!) (0x4A6F7921).
- TIFF-Bilddateien fangen mit „II“ oder „MM“ an, abhängig von der Endianess (II entspricht Intel, MM entspricht Motorola), gefolgt von 0x2A00 bzw. 0x002A (im Dezimalsystem 42).
Das Unix-Kommando
file
liest und interpretiert magische Zahlen aus Dateien. Auch das Linux-Kernelmodul binfmt_misc erkennt anhand magischer Zahlen den Dateityp einer Anwendung.Magische Zahlen in Code
Der Term magische Zahl (engl. magic number) bezeichnet auch den schlechten Programmier-Stil, Zahlen direkt im Quellcode zu benutzen. In vielen Fällen macht dies Programme schwerer lesbar und unverständlich. Besser kann es sein, Zahlen mit Bedeutung als Konstante zu definieren und so mit einem Namen zu versehen. Außerdem lässt sich so eine Zahl besser im gesamten Code ändern, da meistens andere Zahlen von ihr abhängen.
Ein Beispiel in Pseudocode, das 52 Zahlen in einem Array mischt:
for i from 1 to 52 j:= i + randomInt(53 - i) - 1 swapEntries(i, j)
Die Funktion
randomInt(x)
generiert eine Zahl zwischen 1 und x, undswapEntries(i, j)
vertauscht die Einträge i und j im Array. 52 ist dabei eine magische Zahl. Besserer Stil ist das folgende Programm:constant int deckSize:= 52 for i from 1 to deckSize j:= i + randomInt(deckSize + 1 - i) - 1 swapEntries(i, j)
Die Vorteile daran sind:
- Einfacher zu verstehen. Ein Programmierer, der das erste Programm liest, wird sich nach der Bedeutung der 52 fragen, und eventuell lange suchen, bevor er den Sinn dahinter erfasst.
- Einfacher zu ändern. Wenn man im oberen Beispiel die magische Zahl ändern möchte, muss man weitere Zahlen ändern. In größeren Programmen wird dies extrem unübersichtlich. Es entstehen Fehler, die man später aufwendig suchen muss. Im Gegensatz dazu muss man im unteren Beispiel lediglich eine einzige Zeile ändern.
- Sämtliche magische Zahlen befinden sich am Anfang des Programmes, so dass man den Überblick behält.
- Es vereinfacht Parametrisierung. Soll also das obige Programm beliebig große Arrays mischen, kann man aus deckSize einfach einen Parameter machen. Beispiel:
function shuffle (int deckSize) for i from 1 to deckSize j:= i + randomInt(deckSize + 1 - i) - 1 swapEntries(i, j)
- Tippfehler werden vermieden. Der Compiler wird kein Problem haben, wenn man statt 52 die Zahl 62 tippt, das Programm wird aber nicht ordnungsgemäß funktionieren. Tippt man dagegen dekSize, wird der der Fehler schon vom Compiler erkannt.
Nachteile sind:
- Der Code wird verlängert. Wenn viele Konstanten in einer Zeile genutzt werden, müssen Zeilenumbrüche eingefügt werden.
- Es erschwert das Debugging auf Systemen, auf denen die Werte von Konstanten nicht angezeigt werden.
- Bei nicht sinnvoll eingeführten Konstanten muss der Leser ggf. einen weiteren Blick auf die Definition werfen.
Magische Zahlen in der Programmierung
Hexadezimalzahlen werden oft dazu benutzt, Werte auf Datenträgern bzw. anderem Speicher darzustellen. Die meisten Zahlen sehen dabei recht "uninteressant" und "zufällig aus". Manchmal ist es aber vorteilhaft, einen sofort auffallenden Wert zu haben (beispielsweise bei der Fehlersuche).
0xDEADBEEF (dezimal: 3.735.928.559) ist eine Zahl in hexadezimaler Notation, die als „dead beef“ (engl. Totes Rindfleisch) gelesen wird.
Normalerweise tritt ein Wert wie 0xDEADBEEF eher selten auf und wird somit dazu verwendet, besondere Werte anzuzeigen. Die Zahl an sich hat dabei keine spezielle Bedeutung und kann genauso durch andere Werte wie 0xABABABAB, 0x00C0FFEE oder 0xBAADF00D (engl. „bad food“, etwa „schlechtes Essen“) ersetzt werden.
Da ein solcher Wert selten vorkommt (mit einer Wahrscheinlichkeit von 1:2^32 = 1:4.294.967.296), wird er oft von Softwareentwicklern dazu benutzt, Fehler wie Pufferüberläufe oder uninitalisierte Variablen zu finden bzw. zu untersuchen. Wenn der Wert also im Speicher auftaucht, sollte der Programmierer sich diese Stelle genauer ansehen. Auch werden zu Debuggingzwecken Speicherbereiche, welche vom Programm nicht beschrieben werden sollten, mit 0xDEADBEEF vollgeschrieben. Schreibt das Programm in diesem Bereich, wird es sofort bemerkt.
Viele Versionen des PowerPC-Prozessors initialisieren ihre Register mit 0xDEADBEEF nach einem Hardware-Reset. 0xDEADBEEF wurde im originalen Mac-OS-Betriebssystem zu Diagnosezwecken benutzt, und sichtbarer auch bei den 1990 eingeführten RS/6000-Servern von IBM.
Siehe auch: Hexspeak, für die Transskription von Wörtern in hexadezimale Zahlen.
Referenzen
Wikimedia Foundation.