- Tar-gzip
-
gzip
Hilfeanzeige in der KommandozeileBasisdaten Entwickler: Jean-loup Gailly und Mark Adler Betriebssystem: plattformübergreifend verfügbar Kategorie: Datenkompression Lizenz: GPL (Freie Software) gzip.org gzip ist ein Kompressionsprogramm, welches, ebenso wie das entsprechende Dateiformat gzip, praktisch für alle Computerbetriebssysteme verfügbar ist (unter den Bedingungen der GPL auch im Quelltext).
Allgemein ist gzip die Kurzform für GNU zip. OpenBSD hat eine BSD-lizenzierte Reimplementierung mit dem Namen gratis Zip vorgenommen, die aber völlig kompatibel zu den GNU-Werkzeugen ist.
gzip bietet einen guten Kompressionsgrad und ist frei von patentierten Algorithmen. Es wurde ursprünglich von Jean-Loup Gailly entwickelt, um unter Unix das alte Programm compress zu ersetzen. Mark Adler schrieb das Dekompressionsprogramm gunzip.
Inhaltsverzeichnis
Technik
gzip basiert auf dem Deflate-Algorithmus, der eine Kombination aus LZ77 und Huffman-Kodierung ist. Deflate wurde als Reaktion auf die Patente entwickelt, die auf LZW und andere Kompressionsalgorithmen bestanden. Auch das ZIP-Dateiformat verwendet hauptsächlich Deflate zur Komprimierung, darf aber ansonsten nicht mit gzip verwechselt werden.
Um die Entwicklung von Software zu vereinfachen, die Datenkompression nutzt, wurde die zlib-Bibliothek geschrieben. Sie unterstützt das gzip-Dateiformat und die Deflate-Kompression. Die Bibliothek ist weit verbreitet, da sie klein, effizient und vielseitig ist.
Beispielaufrufe
Eine Datei packen:
gzip <Dateiname>
Eine gepackte Datei entpacken:
gzip -d <Dateiname> oder gunzip <Dateiname>
Eine komprimierte Text-Datei ausgeben:
zcat <Dateiname>
Eine defekte komprimierte Datei bis zur Fehlerstelle retten/entpacken:
zcat <gzip-Datei> > <Ziel-Datei>
gzip-komprimierte Dateien
gzip Dateiendung .gz, .tgz
MIME-Type application/x-gzip
Magische Zahl \x1F\x8B\x08 (ASCII-C-Notation) Entwickelt von Jean-loup Gailly und Mark Adler Art Datenkompression Container für eine beliebige Datei Erweitert von compress Standard(s): RFC 1952 Website: gzip.org Die übliche Dateiendung für gzip-komprimierte Dateien ist heute
.gz
, früher auch.z
. Da gzip nur einzelne Dateien komprimiert, werden Sammlungen mehrerer Dateien üblicherweise zunächst mit tar zu einem sogenannten Tarball zusammengefasst, bevor sie mit gzip komprimiert werden. Solche Sammlungen tragen dann meist die doppelte Endung.tar.gz
oder auch einfach.tgz
. Diese Methode ermöglicht insgesamt bessere Komprimierung, da so Redundanzen zwischen den einzelnen Dateien ausgenutzt werden können (progressive Kompression), erschwert aber den Zugriff auf die einzelnen Bestandteile.Verbreitung
Unter Unix ist die Komprimierung mit gzip heute Standard, weil sie für viele Aufgaben einen guten Kompromiss aus hoher Geschwindigkeit und guter Datenreduktion ermöglicht. Wo es weniger auf Geschwindigkeit als auf minimale Dateigrößen ankommt (etwa bei der breiten Verteilung von Daten über relativ langsame Netze), wird allerdings zunehmend bzip2 verwendet (ebenso wie bei gzip in Kombination mit tar).
Das zlib-komprimierte Dateiformat, der Deflate-Algorithmus und das gzip-Dateiformat wurden 1996 als Request for Comments RFC 1950, RFC 1951 und RFC 1952 standardisiert.
Siehe auch
Weblinks
- gzip.org (englisch)
- RFC 1952: GZIP file format specification version 4.3, Mai 1996 (englisch)
gzip(1)
– Linux-Manpage (Englisch)- goethe.ira.uka.de/seminare/rftk/zip – Gut verständliche Beschreibung der verschiedenen Komprimiermöglichkeiten.
Wikimedia Foundation.