- Decompiler
-
Der Begriff Dekompilierer oder englisch Decompiler bezeichnet ein Computerprogramm, das aus den Datenbytes der Maschinensprache oder manchmal auch aus Daten im Objektcode wieder lesbaren Quellcode in einer Hochsprache erzeugt. Seine Arbeitsweise ist somit genau umgekehrt zu der eines Compilers. Dies ist nicht zu verwechseln mit einem Disassembler, der Maschinensprache in Assemblersprache rückübersetzt. Andere Bezeichnungen für Decompiler sind Reverse Compiler bzw. Reverse Engineering Compiler.
Inhaltsverzeichnis
Funktionsweise
Dekompilierung ist eine Reverse-Engineering-Technik zum erneuten nachträglichen Erzeugen von Quellcode basierend auf einem ausführbaren Programm. Der gewonnene Quellcode hat in gewissen Grenzen Ähnlichkeit mit der Ursprungsfassung des Quellcodes, der zur Erzeugung des ausführbaren Programms benutzt wurde. Wenn in diesem ausführbaren Programm zusätzlich noch Debuginformationen gespeichert sind, dann können oft sogar die vom ursprünglichen Autor verwendeten Variablennamen, Funktionsnamen und Module wieder zurückgewonnen werden. Verlorengegangen sind üblicherweise Kommentare, sowie die ursprüngliche Formatierung, da beide Informationen typischerweise nicht mehr im Compilat enthalten sind.
Die Dekompilierung von Java- und .NET-Programmen ist in der Regel unkomplizierter als die Dekompilierung von normalen Binary-Programmen, da diese Systeme relativ viele Informationen des Originalquellcodes mit in die Objektdatei übernehmen, vergleichbar mit der Debug-Version eines C- oder C++-Programms. Insbesondere die Typinformation und die Namen von öffentlichen Bezeichnern bleiben erhalten. Der dekompilierte Programmcode ist jedoch nur funktional identisch mit der ursprünglichen Quelldatei.
Einschränkungen
Wurde das Programm hingegen mit einer Optimierungsoption des Compilers übersetzt und es sind keine Debuginformationen enthalten, oder es wurde gar mit einem Obfuscator verschleiert, dann kann der zurückgewonnene Quelltext in Einzelfällen bis zur Unbenutzbarkeit entstellt sein.
Aufgrund der genannten Einschränkungen eignet sich Dekompilierung eigentlich nicht, um verlorengegangene Quelltexte zu restaurieren. Diese sollten als kostbarstes Gut der Softwarehersteller ohnehin immer in vielfachen Sicherungen vorhanden sein. Unter normalen Umständen wird ein Programmierer niemals einen Decompiler einsetzen müssen. Bei sehr alter Software kommt es jedoch hin und wieder vor, dass die Ursprungsquellen verloren wurden oder sich auf Datenträgern befinden, für die keine passenden Lesegeräte mehr verfügbar sind. In den Anfangszeiten der elektronischen Datenverarbeitung war es außerdem eine weit verbreitete Unart, kleine Fehler durch patchen der Objektdateien zu beheben. Diese Fälle sind neben dem Rückentwickeln fremder Software die einzigen Ausnahmen, für die Decompiler zum Einsatz kommen.
Rechtliches
Kommerzielle Softwareanbieter weisen in ihren Lizenzen oft darauf hin, dass das Decompilieren ihrer Produkte verboten sei (sei es auch nur zu Studienzwecken oder um die Software für den Eigengebrauch zu verändern).
Allerdings ist es nach § 69e, UrhG in Deutschland erlaubt, ein Programm zu dekompilieren, soweit dies notwendig ist, um die „Interoperabilität“ mit einem unabhängig vom ursprünglichen Programm geschaffenen Computerprogramm zu erhalten. Lizenzvereinbarungen, die dem widersprechen, sind nichtig.
Siehe auch
- Assembler
- Disassembler
- Interpreter
- Linker
- Reverse Engineering zu rechtlichen Aspekten
- Obfuscator
Weblinks
(allesamt in englischer Sprache)
- http://boomerang.sourceforge.net - Der Boomerang Decompiler ist ein Versuch, einen freien Mehrzweck-Decompiler zu entwickeln. Gegenwärtig kann er kleine Binarys (Intel x86 und SPARC) nach C übersetzen. Er ist unter einer BSD-artigen Lizenz verfügbar und läuft unter Unix und Windows.
- http://www.backerstreet.com/rec/rec.htm - REC (Reverse Engineering Compiler) von Giampiero Caprino. REC ist ein portierbarer Decompiler. Er liest eine ausführbare Datei und versucht eine C-ähnliche Repräsentation des Codes und der Daten des Programms zu erstellen. Der Sourcecode zu REC ist nicht öffentlich, aber das Programm kann für mehrere Plattformen kostenlos heruntergeladen werden.
- http://www.program-transformation.org/Transform/DeCompilation - Das DeCompilation Wiki diskutiert verschiedene Aspekte der Dekompilierung: Geschichte, Forschung, Mustersuche, die generelle Herangehensweise, Java-Decompiler (und warum diese so viel besser als Binary-Decompiler funktionieren) usw.
- http://wiki.sharpdevelop.net/ILSpy.ashx - kostenfreier und quellcodeoffener Decompiler für .NET
- http://reflector.red-gate.com/download.aspx?TreatAsUpdate=1 - inzwischen kostenpflichtiger Decompiler für .NET
Wikimedia Foundation.