- Forward-Algorithmus
-
Der Forward-Algorithmus (auch Vorwärts-Algorithmus, Vorwärts-Prozedur) berechnet mit Hilfe der Forward-Variablen αt(i) für ein gegebenes Hidden-Markov-Modell λ die Wahrscheinlichkeit P einer Beobachtung O, d.h. P(O | λ). Er verwendet die Programmiermethode der dynamischen Programmierung.
Inhaltsverzeichnis
Markov-Modell
Das Markov-Modell λ ist definiert als λ = (S,A,B,π,V), wobei
- S die Menge der verborgenen Zustände,
- A die Matrix der Übergangswahrscheinlichkeiten,
- B die Menge der Emissionswahrscheinlichkeiten,
- π die Anfangswahrscheinlichkeitsverteilung für die möglichen Anfangszustände,
- und V das Alphabet der beobachteten Symbole
bezeichnet.
Forward-Variable
Die Forward-Variable, d.h. die Wahrscheinlichkeit, zum Zeitpunkt t die Beobachtung gemacht zu haben und im Zustand si zu sein, ist:
Funktionsweise
αt(i) (und damit auch die Gesamtwahrscheinlichkeit P) lässt sich rekursiv berechnen:
- 1. Initialisierung
- 2. Rekursion,
- 3. Terminierung
Komplexität
Der Algorithmus benötigt O( | S | 2T) Operationen und bietet ein effizientes Verfahren zur Berechnung der gesuchten Wahrscheinlichkeit P. Der Speicherbedarf liegt in O( | S | T), da zur Erreichung der polynomiellen Laufzeit alle αt(j) in einer Matrix gespeichert werden.
Wenn die Zwischenergebnisse von αt(j) für t < T nach der Beendigung der Rekursion nicht benötigt werden, dann reduziert sich der Speicherbedarf auf O( | S | ), da 2 Spaltenvektoren der Länge | S | ausreichen um αt − 1(j) und αt(j) in jedem Rekursionsschritt zu speichern.
Erläuterungen
Die Forward-Variable αt(i) wird zusammen mit der Backward-Variable βt(i) für den Baum-Welch-Algorithmus zur Lösung des mit Hidden-Markov-Modellen gegebenen Lernproblems benötigt.
Siehe auch
Literatur
- Richard Durbin u. a.: Biological sequence analysis. Probabilistic models of proteins and nucleic acids. 11th printing, corrected 10. reprinting. Cambridge University Press, Cambridge u. a. 2006, ISBN 0-521-62971-3, S. 59.
Wikimedia Foundation.