Kosinustransformation

Kosinustransformation

Die Diskrete Kosinustransformation (DCT, engl.: „Discrete Cosine Transformation“) ist eine lineare, orthogonale Transformation, die ähnlich der Diskreten Fouriertransformation (DFT) ein zeitdiskretes Signal vom Orts- in den Frequenzbereich transformiert. 1974 wurde sie erstmals von Ahmed, Natarjan und Rao erwähnt. Seit diesem Zeitpunkt ist sie die am weitesten verbreitete Transformation zur Redundanzreduktion von Bildsignalen.

2-Dimensionale FDCT und IDCT

Gründe für diese Präferenz:

  • Die DCT transformiert Bilddaten effizient in eine Form, die gut komprimiert werden kann.
  • Im Gegensatz zur DFT rechnet man bei der DCT nicht mit komplexen, sondern nur mit reellen Koeffizienten.
  • Die DCT kann sowohl in Software als auch in Hardware effizient implementiert werden.
  • Über die Verwendung von DSPs bzw. MACs lässt sich die DCT-Berechnung stark beschleunigen.

Im Folgenden werden die Abkürzungen FDCT für forward discrete cosine transform und IDCT für inverse discrete cosine transform verwendet.


Inhaltsverzeichnis

Berechnung der zweidimensionalen (2D) FDCT

Statt 64 Einzelpunkte wird jeder 8×8-Block als Linearkombination dieser 64 Blöcke dargestellt

Um Korrelation in horizontaler und vertikaler Bildrichtung zu erfassen, wird die zweidimensionale Variante der FDCT benutzt. Zu diesem Zweck wird das Bild in Blöcke von N×N Bildpunkten zerlegt. Normalerweise ist N=8. Die folgende Gleichung beschreibt die zweidimensionale FDCT für einen N×N-Block eines Bildes.

 
F_{x,y}=\frac{2 \cdot C(x)\cdot C(y)}{N}\cdot\sum_{i=0}^{N-1}\sum_{j=0}^{N-1} f_{i,j}\cdot\cos\left(\frac{(2i+1)\cdot x\cdot\pi}{2\cdot N}\right)\cdot\cos\left(\frac{(2j+1)\cdot y\cdot\pi}{2\cdot N}\right)

In dieser Gleichung sind fi,j die N×N Punkte (i,j) des Eingangsblocks, Fx,y sind die N×N DCT-Koeffizienten (x,y) und C(x), C(y) sind die Konstanten:


C(n)=\left\{
  \begin{matrix}
    &\frac{1}{\sqrt2},&&n&=0\\
    &1,&&n&\neq0
  \end{matrix}
  \right.

Die FDCT repräsentiert jeden Block eines Bildausschnittes durch gewichtete Summen von 2D-Kosinusfunktionen, auch Basisfunktionen genannt.

Das Muster links oben hat die niedrigste "Frequenz" und ist nur ein Einheitsblock. Von links nach rechts nimmt die Anzahl der "Zyklen" zwischen hell und dunkel in horizontaler Richtung zu. Diese "Zyklen" repräsentieren horizontal zunehmende räumliche Frequenz. Von oben nach unten nimmt hingegen die Anzahl der "Zyklen" zwischen hell und dunkel in vertikaler Richtung zu. Folglich nehmen sowohl die horizontalen als auch die vertikalen Frequenzen in diagonaler Richtung gleichzeitig zu. Zur Rekonstruktion der Bildpunkte eines Blocks werden diese Basismuster mit dem jeweiligen Gewichtungsfaktor multipliziert und dann addiert. Dieser Faktor entspricht dem jeweiligen DCT-Koeffizienten Fx,y

Berechnung der zweidimensionalen (2D) IDCT

Die IDCT (inverse DCT) rekonstruiert einen Block mit Bildpunkten aus einem Datenfeld mit DCT-Koeffizienten. Als Eingang bedient sich die IDCT eines Blocks von N×N DCT-Koeffizienten Fx,y und rekonstruiert dann nach folgender Gleichung den Block aus den Bildpunkten fi,j.


f_{i,j}=\sum_{x=0}^{N-1}\sum_{y=0}^{N-1}\frac{2\cdot C(x)\cdot C(y)}{N}\cdot F_{x,y}\cdot\cos\left(\frac{(2i+1)\cdot x\cdot\pi}{2\cdot N}\right)\cdot\cos\left(\frac{(2j+1)\cdot y\cdot\pi}{2\cdot N}\right)

Die Konstanten C(y) und C(x) sind dieselben wie für die FDCT.

DCT-Koeffizienten

Wie aus der Abbildung rechts ersichtlich kann mit relativ guter Genauigkeit aus sechs Koeffizienten das Originalbild rekonstruiert werden. Der erste Koeffizient (0,0) wird mit einer Gewichtung von 967,5 multipliziert und mit der IDCT transformiert. Dieser Koeffizient ist meistens der wichtigste, denn er gibt den durchschnittlichen Grauwert oder "Schatten" des Blocks an. In diesem Fall wird der oben beschriebene Vorgang noch fünfmal für die weiteren DCT-Koeffizienten wiederholt. Da in den meisten Fällen die Gewichtung der anderen DCT-Koeffizienten, wie in diesem Beispiel, relativ niedrig ist, kann man die meisten Blöcke mit einer geringen Anzahl von DCT-Koeffizienten rekonstruieren.

Siehe auch

Literatur

  • Ahmed, N., Natarajan T. und Rao K. R.: Discrete cosine transform. IEEE Trans. Computers, Januar 1974
  • Richardson, Ian E. G.: Video Codec Design. John Wiley & Sons, LTD, 2002. ISBN 0-471-48553-5
  • Philipp W.Besslich, Tian Lu: Diskrete Orthogonaltransformationen. Springer Verlag, 1990. ISBN 3-540-52151-8

Wikimedia Foundation.

Игры ⚽ Поможем сделать НИР

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Diskrete Kosinustransformation — Die Diskrete Kosinustransformation (DCT, engl.: „Discrete Cosine Transformation“) ist eine reellwertige diskrete lineare orthogonale Transformation, die ähnlich der diskreten Fouriertransformation (DFT) ein zeitdiskretes Signal vom Zeitbereich… …   Deutsch Wikipedia

  • Modifizierte diskrete Kosinustransformation — Die modifizierte diskrete Kosinustransformation (englisch Modified Discrete Cosine Transform, MDCT) ist eine reellwertige, diskrete, lineare, orthogonale Transformation, die zu der Gruppe der diskreten Fouriertransformationen (DFT) zählt und eine …   Deutsch Wikipedia

  • .jpe — Dieser Artikel beschreibt die Norm zur Bildkompression. Für das Dateiformat mit der Dateiendung .jpg oder .jpeg, in dem mit diesen Verfahren komprimierte Bilder üblicherweise gespeichert werden, siehe JPEG File Interchange Format. Ein Bild einer… …   Deutsch Wikipedia

  • .jpeg — Dieser Artikel beschreibt die Norm zur Bildkompression. Für das Dateiformat mit der Dateiendung .jpg oder .jpeg, in dem mit diesen Verfahren komprimierte Bilder üblicherweise gespeichert werden, siehe JPEG File Interchange Format. Ein Bild einer… …   Deutsch Wikipedia

  • .jpg — Dieser Artikel beschreibt die Norm zur Bildkompression. Für das Dateiformat mit der Dateiendung .jpg oder .jpeg, in dem mit diesen Verfahren komprimierte Bilder üblicherweise gespeichert werden, siehe JPEG File Interchange Format. Ein Bild einer… …   Deutsch Wikipedia

  • Jpg — Dieser Artikel beschreibt die Norm zur Bildkompression. Für das Dateiformat mit der Dateiendung .jpg oder .jpeg, in dem mit diesen Verfahren komprimierte Bilder üblicherweise gespeichert werden, siehe JPEG File Interchange Format. Ein Bild einer… …   Deutsch Wikipedia

  • JPEG — Ein Bild einer Phalaenopsis mit von links nach rechts abnehmenden Qualitätsstufen. JPEG ([dʒeɪpɛɡ]) ist die gebräuchliche Bezeichnung für die 1992 vorgestellte Norm ISO/IEC 10918 1 bzw. CCITT Recommendation T.81, die verschiedene Methoden der… …   Deutsch Wikipedia

  • Grafikkomprimierung — Bildkompression beruht wie jede Anwendung der Datenkompression darauf, den ursprünglichen Datensatz entweder in eine vollständig rekonstruierbare Form zu ändern oder Daten zu entfernen, deren Verlust kaum wahrnehmbar ist. Es gibt sehr viele… …   Deutsch Wikipedia

  • Graphikkompression — Bildkompression beruht wie jede Anwendung der Datenkompression darauf, den ursprünglichen Datensatz entweder in eine vollständig rekonstruierbare Form zu ändern oder Daten zu entfernen, deren Verlust kaum wahrnehmbar ist. Es gibt sehr viele… …   Deutsch Wikipedia

  • ISO/IEC 14496 — MPEG 4 ist ein MPEG Standard (ISO/IEC 14496), der unter anderem Verfahren zur Video und Audiodatenkompression beschreibt. Ursprünglich war das Ziel von MPEG 4, Systeme mit geringen Ressourcen oder schmalen Bandbreiten (Mobiltelefon, Video Telefon …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”