- Bytes
-
Einheit Norm IEC 60027-2 Einheitenname Byte, Oktett Einheitenzeichen B Beschriebene Größe(n) Daten In SI-Einheiten Siehe auch: Bit Das Byte [baɪt] ist ein Mengen-Begriff aus der Digitaltechnik und Informatik, der für eine Zusammenstellung von mehreren (heute fast immer 8) Bit steht. Um ausdrücklich auf eine Anzahl von 8 Bit hinzuweisen, wird auch die Bezeichnung Oktett verwendet.
Inhaltsverzeichnis
Definitionen
Was genau ein Byte bezeichnet, wird je nach Anwendungsgebiet etwas unterschiedlich definiert. Der Begriff kann stehen für:
- eine Maßeinheit für eine Datenmenge von 8 Bit mit dem Einheitenzeichen „B“[1], wobei es nicht auf die Ordnung der einzelnen Bit ankommt.
- eine geordnete Zusammenstellung (n-Tupel) von 8 Bit, deren formale ISO-konforme Bezeichnung Oktett ist (1 Byte = 8 Bit). Ein Oktett wird manchmal in zwei Hälften zu je 4 Bit (Nibble) zerlegt, wobei jedes Nibble durch eine hexadezimale Ziffer (0–9, A–F) darstellbar ist. Ein Oktett kann also durch zwei Hexadezimalziffern dargestellt werden.
- eine adressierbare Speichereinheit, die groß genug ist, um ein beliebiges Zeichen aus dem Basis-Zeichensatz aufzunehmen.
- bei Telex: 1 Zeichen = 5 Bit
- bei Sixbit: 1 Zeichen = 6 Bit
- bei ASCII: 1 Zeichen = 7 Bit
- bei IBM-PC: 1 Zeichen = 8 Bit = 1 Byte = 1 Oktett
- bei Rechnersystemen der Typen UNIVAC 1100/2200 und OS2200 Series: 1 Zeichen = 9 Bit = 1 Byte
- bei Radix-50: 1 Zeichen =
- einen Datentyp in Programmiersprachen. Die Anzahl Bit pro Byte kann je nach Programmiersprache und Plattform variieren (meistens 8 Bit).
Bei den meisten heutigen Rechnern fallen alle diese Definitionen in eine zusammen.
Der Begriff Byte wird aufgrund der großen Verbreitung von Systemen, die auf acht Bit (beziehungsweise Zweierpotenzvielfache davon) basieren, für die Bezeichnung einer acht Bit breiten Größe verwendet, die in formaler Sprache (entsprechend ISO-Normen) aber korrekt Oktett (engl.: octet) heißt. Als Maßeinheit bei Größenangaben wird in der deutschen Sprache der Begriff Byte (im Sinne von 8 Bit) verwendet. Bei der Übertragung kann ein Byte parallel (alle Bit gleichzeitig) oder seriell (alle Bit nacheinander) übertragen werden. Zur Sicherung der Richtigkeit werden oft Prüfbits angefügt. Bei der Übertragung größerer Mengen sind weitere Übertragungsprotokolle möglich. So werden bei 32-Bit-Rechnern oft 32 Bit (vier Byte) gemeinsam in einem Schritt übertragen, auch wenn nur ein 8-Bit-Tupel übertragen werden muss. Das ermöglicht eine Vereinfachung der zur Berechnung erforderlichen Algorithmen und einen kleineren Befehlssatz des Computers.
Praktische Verwendung
In der elektronischen Datenverarbeitung nennt sich die kleinstmögliche Speichereinheit Bit. Ein Bit kann zwei mögliche Zustände annehmen, die meist als „Null“ und „Eins“ bezeichnet werden.
Acht solcher Bits werden zu einer Einheit – sozusagen einem Datenpäckchen – zusammengefasst und allgemein Byte genannt. Die offizielle ISO-konforme Bezeichnung lautet dagegen Oktett: 1 Oktett = 1 Byte = 8 Bit.
Das Byte ist die Standardeinheit, um Speicherkapazitäten oder Datenmengen zu bezeichnen. Dazu gehören Dateigrößen, die Kapazität von permanenten Speichermedien (Festplatten, CDs, DVDs, Blu-Ray Discs, Disketten, USB-Massenspeichergeräte usw.) und die Kapazität von vielen flüchtigen Speichern (z. B. Arbeitsspeicher). Übertragungsraten (z. B. die maximale Geschwindigkeit eines Internet-Anschlusses) gibt man dagegen üblicherweise auf der Basis von Bits an.
Präfixe für große Anzahlen von Bytes
SI-Präfixe zur Basis 10
Für Datenspeicher mit binärer Adressierung ergeben sich Speicherkapazitäten von 2n Byte, d. h. Zweierpotenzen. Da es bis 1996 keine speziellen Einheitenvorsätze für Zweierpotenzen gab, hat es sich verbreitet, die SI-Präfixe im Zusammenhang mit Speicherkapazitäten zur Bezeichnung von Zweierpotenzen zu verwenden (mit Faktor 210 = 1024 statt 1000), z. B.:
- 1 Kilobyte (kB) = 1024 Byte, 1 Megabyte (MB) = 1024 Kilobyte = 1024 · 1024 Byte = 1.048.576 Byte usw.
Diese binäre Verwendung der SI-Präfixe wurde 1986 von der IEEE auch in einem Glossar dokumentiert.[2]
Vereinzelt kommen auch Mischformen vor, z. B. bei der Speicherkapazität einer 3,5″-Diskette: 1,44 MB = 1440 kB = 1440 × 1024 Byte.
IEC-Präfixe zur Basis 2
Um Mehrdeutigkeiten zu vermeiden, schlug die IEC 1996 neue Einheitenvorsätze vor, die nur in der binären Bedeutung verwendet werden sollten.[3]
Beispiele für die Anwendung dieser Binärpräfixe sind:
- 1 Kibibyte (KiB) = 1024 Byte, 1 Mebibyte (MiB) = 1024 · 1024 Byte.
Außerdem wurde empfohlen, die SI-Präfixe nur noch in der dezimalen Bedeutung zu benutzen, damit sich sowohl für Zweierpotenzen als auch für Zehnerpotenzen eindeutige Bezeichnungen ergeben, z. B.:
- 1 Kilobyte (kB) = 1000 Byte, 1 Megabyte (MB) = 1.000.000 Byte.
Viele Standardisierungsorganisationen schlossen sich dieser Empfehlung an. Darunter sind zu nennen das BIPM (1998), die IEEE (2002) und speziell in Deutschland die Physikalisch-Technische Bundesanstalt (2007)[4].
Die Akzeptanz für diese IEC-Binärpräfixe ist in der IT-Branche bis heute gering, nimmt aber wegen der wachsenden Speichergrößen und den daher zunehmenden ökonomischen Folgen eines Missverständnisses zu. Moderne Betriebssysteme wie OSX und Linux geben daher Speichergrößen bereits zunehmend unter Verwendung der Binärpräfixe an.
Größenunterschiede zwischen den Bedeutungsauffassungen
Eine Übersicht über die möglichen Einheitenvorsätze und deren Bedeutungen bietet die folgende Tabelle:
Dezimalpräfixe Binärpräfixe Name
(Symbol)Bedeutung analog zu SI-Präfixen[G 1] Unterschied Name
(Symbol)Tradierte Bedeutungsauffassung Kilobyte (kB)[G 2] 103 Byte = 1.000 Byte 2,4 % Kibibyte (KiB)[G 3] 210 Byte = 1.024 Byte Megabyte (MB) 106 Byte = 1.000.000 Byte 4,9 % Mebibyte (MiB) 220 Byte = 1.048.576 Byte Gigabyte (GB) 109 Byte = 1.000.000.000 Byte 7,4 % Gibibyte (GiB) 230 Byte = 1.073.741.824 Byte Terabyte (TB) 1012 Byte = 1.000.000.000.000 Byte 10,0 % Tebibyte (TiB) 240 Byte = 1.099.511.627.776 Byte Petabyte (PB) 1015 Byte = 1.000.000.000.000.000 Byte 12,6 % Pebibyte (PiB) 250 Byte = 1.125.899.906.842.624 Byte Exabyte (EB) 1018 Byte = 1.000.000.000.000.000.000 Byte 15,3 % Exbibyte (EiB) 260 Byte = 1.152.921.504.606.846.976 Byte Zettabyte (ZB) 1021 Byte = 1.000.000.000.000.000.000.000 Byte 18,1 % Zebibyte (ZiB) 270 Byte = 1.180.591.620.717.411.303.424 Byte Yottabyte (YB) 1024 Byte = 1.000.000.000.000.000.000.000.000 Byte 20,9 % Yobibyte (YiB) 280 Byte = 1.208.925.819.614.629.174.706.176 Byte Unterscheidung von Dezimal- und Binärpräfixen
Für höherwertige Präfixe wird die eindeutige Unterscheidung von Dezimal- und Binärpräfixen zunehmend wichtiger, da der Unterschied zwischen Präfixen dezimaler und binärer Bedeutung immer größer wird und daher nicht mehr vernachlässigt werden kann. So beträgt der Unterschied zwischen kB und KiB erst 2,4 %, der von TB und TiB hingegen bereits 10 %.
Standardisierung
Das für die SI-Präfixe zuständige Internationale Büro für Maß und Gewicht (BIPM) rät von der binären Verwendung der SI-Präfixe ausdrücklich ab und empfiehlt für die Bezeichnung von Zweierpotenzen die Binärpräfixe gemäß IEC 60027–2.[5]
In der IT-Praxis sowie in Forschung und Lehre hat sich diese Regelung jedoch bisher nicht allgemein durchsetzen können. Die SI-Präfixe werden weiterhin häufig für Zweierpotenzen verwendet und die Binärpräfixe sind vielfach noch unbekannt.
Kapazitätsangaben bei Speichermedien
Die Hersteller von Dauerspeichermedien, wie Festplatten, DVD-Rohlingen und USB-Speicher-Sticks verwenden die SI-Präfixe wie bei SI-Einheiten, um die Kapazität ihrer Produkte anzugeben. Daraus ergibt sich beispielsweise das Problem, dass ein mit „4,7 GB“ gekennzeichneter DVD-Rohling von Software, welche die SI-Präfixe zur Bezeichnung von Zweierpotenzen verwendet (wie z. B. der Windows Explorer), mit dem formal unterschiedlichen Wert von „4,38 GB“ erkannt wird, obwohl in beiden Fällen ca. 4.700.000.000 Byte gemeint sind. Ebenso wird eine mit „1 TB“ spezifizierte Festplatte mit der scheinbar deutlich kleineren Kapazität von etwa „931 GB“ oder 0,9 TB erkannt, obwohl in allen drei Fällen jeweils 1.000.000.000.000 Bytes gemeint sind.
Geschichte des Begriffs
Bit ist ein Kofferwort aus Binary und digit, heißt also zweiwertige Ziffer – Null oder Eins. Dessen Bestandteile lassen sich auf die lateinischen Wörter digitus (Finger), den bzw. die man seit der Antike zum Zählen verwendet (vgl. Plautus: „computare digitis“) und lat. (genauer neulat.) binarius (zweifach), vgl. lat. bis (zweimal), zurückführen.
Das Wort Byte ist künstlich und stammt von englisch bit (deutsch: bisschen) und bite (deutsch: Biss). Verwendet wurde es, um eine Speichermenge oder Datenmenge zu kennzeichnen, die ausreicht, um ein Zeichen darzustellen. Der Begriff wurde 1956 von Werner Buchholz geprägt in einer frühen Designphase eines IBM-Computers.[6] Im Original beschrieb er eine Breite von 6 Bit und stellte die kleinste direkt adressierbare Speichereinheit eines Computers dar. Die Schreibweise Bite wurde zu Byte geändert, um versehentliche Verwechslungen mit Bit zu vermeiden.
Zur Unterscheidung der ursprünglichen Bedeutung als kleinste adressierbare Informationseinheit und der Bedeutung als 8-Bit-Tupel wird in der Fachliteratur (abhängig vom Fachgebiet) korrekterweise auch der Begriff Oktett für letzteres benutzt, um eine klare Trennung zu erzielen.
Siehe auch
Weblinks
- Prefixes for binary multiples (englisch)
- „Byte.“ From MathWorld (englisch)
- Maßeinheiten – Warum Festplatten plötzlich schrumpfen in der Reihe „Technikärgernis“ auf Spiegel Online
Quellen
- ↑ IEC 60027-2, Ed. 3.0, (2005–08): Letter symbols to be used in electrical technology – Part 2: Telecommunications and electronics.
- ↑ ANSI/IEEE Std 1084-1986 IEEE Standard Glossary of Mathematics of Computing Terminology, 30. Oktober 1986. Zitat: kilo (K). (1) A prefix indicating 1000. (2) In statements involving size of computer storage, a prefix indicating 210, or 1024. mega (M). (1) A prefix indicating one million. (2) In statements involving size of computer storage, a prefix indicating 220, or 1,048,576.
- ↑ Vgl. internationale Norm IEC 60027-2: 2005, 3. Auflage, Letter symbols to be used in electrical technology – Part 2: Telecommunications and electronics veröffentlicht.
- ↑ Physikalisch-Technische Bundesanstalt: PTB-Mitteilungen 117 (2007), Heft 2, S. 22. „Das Internationale Einheitensystem”
- ↑ BIPM – SI-Broschüre, 8. Auflage, März 2006, Abschnitt 3.1: SI-Präfixe. Randnotiz. Siehe auch: BIPM – SI prefixes
- ↑ Byte definition (englisch)
Wikimedia Foundation.