Cosinustransformation

Cosinustransformation

Die Diskrete Kosinustransformation (DCT, engl.: „Discrete Cosine Transformation“) ist eine lineare, orthogonale Transformation, die ähnlich der Diskreten Fouriertransformation (DFT) ein zeitdiskretes Signal vom Orts- in den Frequenzbereich transformiert. 1974 wurde sie erstmals von Ahmed, Natarjan und Rao erwähnt. Seit diesem Zeitpunkt ist sie die am weitesten verbreitete Transformation zur Redundanzreduktion von Bildsignalen.

2-Dimensionale FDCT und IDCT

Gründe für diese Präferenz:

  • Die DCT transformiert Bilddaten effizient in eine Form, die gut komprimiert werden kann.
  • Im Gegensatz zur DFT rechnet man bei der DCT nicht mit komplexen, sondern nur mit reellen Koeffizienten.
  • Die DCT kann sowohl in Software als auch in Hardware effizient implementiert werden.
  • Über die Verwendung von DSPs bzw. MACs lässt sich die DCT-Berechnung stark beschleunigen.

Im Folgenden werden die Abkürzungen FDCT für forward discrete cosine transform und IDCT für inverse discrete cosine transform verwendet.


Inhaltsverzeichnis

Berechnung der zweidimensionalen (2D) FDCT

Statt 64 Einzelpunkte wird jeder 8×8-Block als Linearkombination dieser 64 Blöcke dargestellt

Um Korrelation in horizontaler und vertikaler Bildrichtung zu erfassen, wird die zweidimensionale Variante der FDCT benutzt. Zu diesem Zweck wird das Bild in Blöcke von N×N Bildpunkten zerlegt. Normalerweise ist N=8. Die folgende Gleichung beschreibt die zweidimensionale FDCT für einen N×N-Block eines Bildes.

 
F_{x,y}=\frac{2 \cdot C(x)\cdot C(y)}{N}\cdot\sum_{i=0}^{N-1}\sum_{j=0}^{N-1} f_{i,j}\cdot\cos\left(\frac{(2i+1)\cdot x\cdot\pi}{2\cdot N}\right)\cdot\cos\left(\frac{(2j+1)\cdot y\cdot\pi}{2\cdot N}\right)

In dieser Gleichung sind fi,j die N×N Punkte (i,j) des Eingangsblocks, Fx,y sind die N×N DCT-Koeffizienten (x,y) und C(x), C(y) sind die Konstanten:


C(n)=\left\{
  \begin{matrix}
    &\frac{1}{\sqrt2},&&n&=0\\
    &1,&&n&\neq0
  \end{matrix}
  \right.

Die FDCT repräsentiert jeden Block eines Bildausschnittes durch gewichtete Summen von 2D-Kosinusfunktionen, auch Basisfunktionen genannt.

Das Muster links oben hat die niedrigste "Frequenz" und ist nur ein Einheitsblock. Von links nach rechts nimmt die Anzahl der "Zyklen" zwischen hell und dunkel in horizontaler Richtung zu. Diese "Zyklen" repräsentieren horizontal zunehmende räumliche Frequenz. Von oben nach unten nimmt hingegen die Anzahl der "Zyklen" zwischen hell und dunkel in vertikaler Richtung zu. Folglich nehmen sowohl die horizontalen als auch die vertikalen Frequenzen in diagonaler Richtung gleichzeitig zu. Zur Rekonstruktion der Bildpunkte eines Blocks werden diese Basismuster mit dem jeweiligen Gewichtungsfaktor multipliziert und dann addiert. Dieser Faktor entspricht dem jeweiligen DCT-Koeffizienten Fx,y

Berechnung der zweidimensionalen (2D) IDCT

Die IDCT (inverse DCT) rekonstruiert einen Block mit Bildpunkten aus einem Datenfeld mit DCT-Koeffizienten. Als Eingang bedient sich die IDCT eines Blocks von N×N DCT-Koeffizienten Fx,y und rekonstruiert dann nach folgender Gleichung den Block aus den Bildpunkten fi,j.


f_{i,j}=\sum_{x=0}^{N-1}\sum_{y=0}^{N-1}\frac{2\cdot C(x)\cdot C(y)}{N}\cdot F_{x,y}\cdot\cos\left(\frac{(2i+1)\cdot x\cdot\pi}{2\cdot N}\right)\cdot\cos\left(\frac{(2j+1)\cdot y\cdot\pi}{2\cdot N}\right)

Die Konstanten C(y) und C(x) sind dieselben wie für die FDCT.

DCT-Koeffizienten

Wie aus der Abbildung rechts ersichtlich kann mit relativ guter Genauigkeit aus sechs Koeffizienten das Originalbild rekonstruiert werden. Der erste Koeffizient (0,0) wird mit einer Gewichtung von 967,5 multipliziert und mit der IDCT transformiert. Dieser Koeffizient ist meistens der wichtigste, denn er gibt den durchschnittlichen Grauwert oder "Schatten" des Blocks an. In diesem Fall wird der oben beschriebene Vorgang noch fünfmal für die weiteren DCT-Koeffizienten wiederholt. Da in den meisten Fällen die Gewichtung der anderen DCT-Koeffizienten, wie in diesem Beispiel, relativ niedrig ist, kann man die meisten Blöcke mit einer geringen Anzahl von DCT-Koeffizienten rekonstruieren.

Siehe auch

Literatur

  • Ahmed, N., Natarajan T. und Rao K. R.: Discrete cosine transform. IEEE Trans. Computers, Januar 1974
  • Richardson, Ian E. G.: Video Codec Design. John Wiley & Sons, LTD, 2002. ISBN 0-471-48553-5
  • Philipp W.Besslich, Tian Lu: Diskrete Orthogonaltransformationen. Springer Verlag, 1990. ISBN 3-540-52151-8

Wikimedia Foundation.

Игры ⚽ Нужна курсовая?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Funktionaltransformation — Die Mathematik versteht unter einer Transformation eine Art Abbildung. Die Verwendung dieses Wortes lässt sich grob in drei Bereiche unterteilen: Koordinatentransformationen und Abbildungen, die mit gewissen geometrischen Eigenschaften kompatibel …   Deutsch Wikipedia

  • Transformation (Mathematik) — Die Mathematik versteht unter einer Transformation eine Art Abbildung. Die Verwendung dieses Wortes lässt sich grob in drei Bereiche unterteilen: Koordinatentransformationen und Abbildungen, die mit gewissen geometrischen Eigenschaften kompatibel …   Deutsch Wikipedia

  • Liste von Videofachbegriffen — Alphabetische Aufstellung der im Videobereich verwendeten Fachbegriffe mit deren Abkürzung. Inhaltsverzeichnis A B C D E F G H I J K L M N O P Q R S T U V W X Y Z A …   Deutsch Wikipedia

  • MP3 — Vorlage:Infobox Dateiformat/Wartung/Entwickler fehltVorlage:Infobox Dateiformat/Wartung/Website fehlt MPEG Audio Layer III Dateiendung …   Deutsch Wikipedia

  • MPEG-1 Audio Layer 3 — Vorlage:Infobox Dateiformat/Wartung/owner fehltVorlage:Infobox Dateiformat/Wartung/standard fehltVorlage:Infobox Dateiformat/Wartung/website fehlt MPEG 1 Audio Layer 3 Dateiendung .mp3 MIME Type audio/mpeg …   Deutsch Wikipedia

  • Mp3 — Vorlage:Infobox Dateiformat/Wartung/owner fehltVorlage:Infobox Dateiformat/Wartung/standard fehltVorlage:Infobox Dateiformat/Wartung/website fehlt MPEG 1 Audio Layer 3 Dateiendung .mp3 MIME Type audio/mpeg …   Deutsch Wikipedia

  • Mpeg3 — Vorlage:Infobox Dateiformat/Wartung/owner fehltVorlage:Infobox Dateiformat/Wartung/standard fehltVorlage:Infobox Dateiformat/Wartung/website fehlt MPEG 1 Audio Layer 3 Dateiendung .mp3 MIME Type audio/mpeg …   Deutsch Wikipedia

  • Trigonometrische Interpolation — Die trigonometrische Interpolation ist ein Begriff aus dem mathematischen Teilgebiet der Numerik. Man sucht dabei zu vorgegebenen Punkten ein trigonometrisches Polynom (eine Summe von Sinus und Cosinus gegebener Periodenlängen), welches durch… …   Deutsch Wikipedia

  • Video-Fachbegriffe — Alphabetische Aufstellung der im Videobereich verwendeten Fachbegriffe mit deren Abkürzung. A Antialiasing Kantenglättung AVCHD Video und Audio Aufzeichnungsverfahren AVI Audio Video Interleave B BAS Bild Austast Synchron Signal Betacam Betamax… …   Deutsch Wikipedia

  • Video (Fachbegriffe) — Alphabetische Aufstellung der im Videobereich verwendeten Fachbegriffe mit deren Abkürzung. A Antialiasing Kantenglättung AVCHD Video und Audio Aufzeichnungsverfahren AVI Audio Video Interleave B BAS Bild Austast Synchron Signal Betacam Betamax… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”