- Perfekter Code
-
Ein perfekter Code, oder auch dicht gepackter Code, bezeichnet in der Codierungstheorie einen Blockcode , bei dem jedes Wort nur zu genau einem Codewort eine minimale Hamming-Distanz hat.
Bei der für gewöhnlich verwendeten Maximum-Likelihood Decodierung bedeutet dies, dass jedem empfangenen Wort ein Codewort eindeutig zugeordnet werden kann. Daraus leitet sich die Bezeichnung perfekt ab, denn es gibt keine mehrdeutigen Decodiermöglichkeiten.
Inhaltsverzeichnis
Mathematische Beschreibung
Sei ein Blockcode mit | A | = q, wobei A das verwendete Alphabet darstellt. C habe eine Hammingdistanz von d. Er kann damit
Fehler korrigieren.
Um perfekt zu sein muss die minimale Hammingdistanz zwischen zwei Wörtern eines Codes ungerade sein, da es sonst für ein Wort x mit gibt, was im Widerspruch zur Definition eines perfekten Codes steht.
Da der Code t fehlerkorrigierend ist, kann ein Wort einem Codewort eindeutig zugeordnet werden, wenn die Hammingdistanz ist. Umgekehrt bedeutet dies für ein bestimmtes Codewort c, dass alle Wörter x mit einer Hammingdistanz von höchstens t nach c decodiert werden. Als Menge wird dies so geschrieben:
Diese Menge wird auch als Kugel (manchmal auch Hyperwürfel) mit Radius t um c bezeichnet. Die Anzahl der Elemente von Bt(c) ist dabei:
Für i Fehlerstellen gibt es i aus n mögliche Positionen für die Fehler. Dabei stehen pro Fehlerstelle q − 1 falsche Symbole zur Verfügung. Es gibt | C | Kugeln. Diese sind disjunkte Teilmengen des An. Daraus ergibt sich die Ungleichung
Aufgelöst nach C und mit | An | = qn folgt:
Diese Ungleichung für die Anzahl der Codewörter wird Hammingschranke oder auch Kugelpackungsschranke genannt.
Bei einem perfekten Code sind alle Wörter in einer der Kugeln enthalten (anders ausgedrückt: Die Kugeln überdecken den Raum). Deshalb gilt bei der Hammingschranke für diesen Code dann die Gleichheit.
Alternative Interpretation
Man kann sich diese Grenze auch wie folgt veranschaulichen (der Einfachheit halber nur anhand binärer Codes erläutert, d. h. für q = 2):
Für einen t Fehler korrigierenden Code muss der Decoder genug Information erhalten, um alle folgenden Fälle unterscheiden zu können:
- | C | = 2k verschiedene Informationswörter und jeweils
- alle möglichen Muster von Bitfehlern der n Bits eines Codewortes
Da es Möglichkeiten gibt, i Bitfehler auf n Bits zu verteilen, ergeben sich insgesamt
Fälle, die mit den zur Verfügung stehenden n Bits unterschieden werden müssen, also
- .
Bei einem perfekten Code gilt Gleichheit, das heißt die n Bits tragen exakt die minimal benötigte Information. Diese (Un)Gleichung entspricht der obigen allgemeinen Definition für den Fall q = 2 und | C | = 2k.
Man ist zwar eigentlich nur an der Korrektur der k Informationsbits interessiert, wofür entsprechend weniger Zusatzinformation genügen würde – diese n − k Bits Zusatzinformation müssten dann aber fehlerfrei sein, was natürlich in der Regel nicht gewährleistet werden kann. Daher ist eine Korrektur aller n Bits erforderlich.
Bekannte Perfekte Codes
Falls die Alphabetgröße q eine Primzahlpotenz ist, so gilt: Ist C ein perfekter Code mit Parametern (n, | C | ,d), so gibt es einen Code D mit denselben Parametern, so dass D einer der folgenden Codes ist[1] [2]:
- Ein trivialer Code. Ein Code heißt hier trivial, falls er entweder nur ein einziges Codewort enthält, oder falls er sämtliche qn möglichen Wörter der gegebenen Blocklänge enthält.
- Ein binärer Wiederholungs-Code mit ungerader Codewortlänge. Die Parameter lauten (2m + 1,2,2m + 1), für ein .
- Ein Hamming-Code über dem endlichen Körper , mit Parametern
- Der binäre Golay-Code mit Parametern (23,212,7)
- Der ternäre Golay-Code mit Parametern mit (11,36,5)
Die Codes C und D haben die gleichen Parameter und können somit bei gleicher Blocklänge n gleich viele Fehler korrigieren. Die Umwandlung eines trivialen Codes in einen linearen Code mit denselben Parametern ist einfach: Falls der Code ein einziges Codewort enthält, so kann statt dessen auch der Nullvektor als einziges Codewort dienen, und der entstandene Code ist linear. Der einzige verbleibende triviale Code ist derjenige, der sämtliche qn möglichen Wörter der gegebenen Blocklänge enthält. Dieser ist aber bereits linear. Bei den restlichen Codes aus der Liste handelt es sich bereits um lineare Codes. Es gibt also für jeden perfekten Code, der im Allgemeinen kein linearer Code sein muss, einen linearen Code mit den gleichen Parametern – sofern die Größe des Alphabetes eine Primzahlpotenz ist.
Es ist offen, ob, und für welche Parameter, es nicht triviale perfekte Codes gibt, falls die Alphabetgröße keine Primzahlpotenz ist.
Für praktische Zwecke sind die trivialen Codes uninteressant, da entweder keine Information übertragen werden kann, oder keine Fehler korrigiert werden können.
Einzelnachweise
Wikimedia Foundation.