- Replaygain
-
Replay Gain (aus dem Englischen: Wiedergabe-Verstärkung) ist ein Standard, der beschreibt, wie digitale Audiodateien auf eine gemeinsame wahrgenommene Lautstärke angehoben werden, ohne die in der Datei gespeicherten eigentlichen Audiodaten anzutasten.
Der Lautstärke-Spitzenwert, der mitunter nur wenige Millisekunden lang ist, hat nur sehr wenig Einfluss auf die empfundene Lautstärke, ist aber für die Aussteuerung des Gesamtstücks wichtig.
Inhaltsverzeichnis
Grundlagen
Werden Lieder von verschiedenen Alben, insbesondere Alben unterschiedlichen Produktionsdatums, nacheinander gehört, so fällt eine mitunter stark unterschiedliche Lautstärkeempfindung auf. Ursache dafür kann die im Kontext eines Albums vom Produzenten gewünschte Lautstärke des einzelnen Lieds sein. In den meisten Fällen jedoch liegt der Grund im unterschiedlichen Mastering verschiedener Alben bzw. vor allem der im Laufe der Jahre geänderten dabei angestrebten „Ziellautstärke“. (Zur Hintergrundinformation siehe Artikel „Loudness war“.) Traditionellerweise erfolgt das Anpassen durch Ändern der Lautstärkeeinstellung. Mit der Verfügbarkeit digitaler Medien und der einfachen Möglichkeit, Lieder selbst zusammenzustellen (Wiedergabelisten), bzw. der Möglichkeit einer albumübergreifenden Zufallswiedergabe, tritt der Wunsch nach einer automatisierten Lautstärke-Normalisierung in den Vordergrund.
Obwohl der Begriff in der ursprünglichen Veröffentlichung als Replay Gain geschrieben wurde, wird vermehrt die Schreibweise Replaygain oder auch ReplayGain verwendet.
Technik
Der Einsatz erfolgt zweistufig: Zunächst werden einmalig die benötigten Lautheits-Informationen aus den Audiodaten ermittelt und als Meta-Informationen zusammen mit diesen gespeichert. Anschließend wird bei jeder Wiedergabe mit diesen Informationen die Lautstärke angepasst.
Es werden zunächst die betreffenden Dateien komplett dekodiert und analysiert. Dabei wird (via Effektivwert) ein Wert berechnet, der der wahrgenommenen Durchschnittslautstärke nahe kommen soll, sowie der tatsächliche Spitzenwert erfasst. Dieser wird als ein Korrekturwert, der die Differenz zwischen der erfassten wahrgenommenen Durchschnittslautstärke und einem einheitlichen Niveau von festgelegten 89 dB bringt, als zusätzliche Meta-Informationen in die Datei geschrieben – die restliche Datei bleibt unangetastet.
Erst beim Abspielen kann nun ein dekodierendes Programm, sofern es den Standard unterstützt, diese Werte auslesen und im Moment des Dekodierens zur Korrektur des eigentlichen Audiosignals verwenden.
Um ein einzelnes Musikstück nicht aus dem Gesamtkonzept eines Albums herausfallen zu lassen, kann die Durchschnittslautstärke der Platte als Ganzes berechnet und in der Audiodatei gespeichert werden. Wird beim Abspielen dieser Korrekturwert verwendet, bleiben die (gewollten) relativen Lautstärkeunterschiede zwischen den einzelnen Stücken eines Albums erhalten.
Da die Anpassung beim Dekodieren stattfindet, es sich also nur um ein Tagging handelt, bleibt die restliche Datei unberührt. Die Veränderungen können also auch leicht wieder entfernt werden, von einem nicht kompatiblen Dekodierprogramm werden sie ignoriert. Die Korrektur geschieht optimalerweise, bevor verlustbehaftet komprimierte Dateien in die gewünschte endgültige Abtasttiefe quantisiert werden, so dass ggf. der volle Dynamikbereich, den die jeweilige endgültige Abtasttiefe bietet, genutzt werden kann.
Dies erlaubt Replay-Gain-kompatiblen Audioplayern, die vorhandenen Unterschiede auszugleichen und solche Dateien jeweils mit etwa derselben durchschnittlichen (wahrgenommenen) Lautstärke abzuspielen. So wird vermieden, dass jedes Mal manuell die Lautstärke angepasst werden muss, wenn auf verschiedenen Pegeln gemasterte Stücke nacheinander abgespielt werden. (Diese Anpassung ist nicht zu verwechseln mit der üblichen Aussteuerung, bei der statt der durchschnittlich wahrgenommenen Lautstärke die Spitzenpegel der einzelnen Stücke auf einen einheitlichen Wert gebracht werden.)
Der Replay-Gain-Standard spricht zwar von einem 8-Byte-Bereich in den Kopfdaten der Datei, der für alle Audioformate gleich sein soll, doch viele Formate, wie Ogg Vorbis oder FLAC, besitzen ein eigenes Tag für diese Information. Bei MP3s verwenden Programme wie foobar2000 die Methode, ID3v2-Tags vom Typ TXXX in die Datei zu schreiben.
Geschichte
Der Vorschlag für diesen Standard wurde am 12. Juli 2001 von David Robinson veröffentlicht.
Alternativen
Audiodaten verändern, Rekodierung
Wenn das Anfügen von Metadaten nicht erwünscht oder nicht möglich ist (beispielsweise bei fehlender Unterstützung durch Decoder oder Brennprogramme), so können als Alternative auch die Ausgangs-Audiodaten verändert werden, um die wahrgenommene Lautstärke auf die festgelegte Einheitshöhe zu bringen. Dies ist nicht nur sehr aufwändig, sondern, wenn im Falle von verlustbehafteten Formaten ein Neukodieren nötig wird, auch mit weiteren Generationsverlusten verbunden.
MP3, AAC und Global Gain
Das Programm MP3Gain kann dies für MP3-Dateien auf verlustfreie und reversible Weise vornehmen (allerdings nur mit einer – in der Praxis meistens ausreichenden – Genauigkeit von 1,5 Dezibel). Hierzu werden die Global-Gain-Felder der einzelnen Frames, die den Gesamtpegel des einzelnen MP3-Frame festlegen, manipuliert. Es handelt sich um eine reversible Operation, die direkt an der MP3-Struktur vorgenommen wird. Da keine Rekodierung stattfindet, treten keine Generationsverluste auf. Zusätzlich wird der Datei optional ein Tag hinzugefügt, welches die vorgenommene Korrektur beziffert; mit dessen Hilfe kann die Operation später bei Bedarf rückgängig gemacht werden.
Ähnliches gilt mit AACgain auch für Advanced Audio Coding.
Literatur
- Thomas Görne: Tontechnik. 1. Auflage, Carl Hanser Verlag, Leipzig, 2006, ISBN 3-446-40198-9
- Roland Enders: Das Homerecording Handbuch. 3. Auflage, Carstensen Verlag, München, 2003, ISBN 3-910098-25-8
Weblinks
Wikimedia Foundation.