- Lemma von Arden
-
Das Lemma von Arden trifft eine Aussage über Mengen von Zeichenreihen, welche im Rahmen der formalen Sprachen Gegenstand der theoretischen Informatik, spezieller der Automatentheorie sind.
Inhaltsverzeichnis
Formulierung
Es sei Σ eine beliebiges Alphabet; * stehe für den Kleene-Stern, + für die positive transitive Hülle, für die Konkatenation zweier Zeichenreihen-Mengen und für deren gewöhnliche Vereinigung (in dieser Priorität - Klammerung wird entsprechend vernachlässigt). Dann gilt folgende Äquivalenz:
bzw. folgende Gleichung:
In Worten: Für eine beliebige Zeichenreihen-Menge Z und eine Zeichenreihen-Menge Y, welche das leere Wort ε nicht enthält, hat die Gleichung nur die eine Lösung .
Beweis
Auf die Quantisierung sei in beiden Beweisteilen der besseren Lesbarkeit halber weg verzichtet, was bei Allquantifizierung nicht weiter problematisch ist, solange keine Spezifikationen für die betreffenden Variablen vorgenommen werden. Entsprechende Stellen werden speziell behandelt.
Hinrichtung
Es sei S eine Lösung für X in der Gleichung .
Obermenge
Zunächst wird die Definition des Kleene-Sternes angewendet und die Distributivität der Konkatenation über Vereinigungen genutzt:
Nun lässt sich durch vollständige Induktion über n zeigen, dass für alle gilt:
- Induktions-Hypothese
- Induktions-Anfang
- Induktions-Schritt
Da für verschiedene n alle Yn paarweise disjunkt sind, folgt aus auch die ursprüngliche Obermengen-Beziehung .
Untermenge
Hier wird der Beweis indirekt geführt: Man nimmt an, gilt nicht, womit es mindestens ein Wort w mit geben muss. Weil ist, muss w auch Element von sein oder anders formuliert . Im ersten Fall setzt sich w aus zwei Teilwörtern und zusammen, also w = ys. Da y nicht das leere Wort sein kann (die Quantifizierung fordert ), folgt . Betrachtet man das kleinste der als existierenden angenommenen w, dann müsste außerdem gelten, was aber im Widerspruch zur Annahme steht. Im anderen Fall, also , ergibt sich ebenfalls der Widerspruch . Da beide Fälle in Widersprüchen enden, muss die Annahme falsch gewesen sein, dass nicht gilt.
Rückrichtung
Diese Beweisrichtung ist trivial, da es reicht zu zeigen, dass Y * Z die Gleichung überhaupt löst:
Anwendung
Die zentrale Bedeutung des Arden-Lemmas ist seine Anwendung in der Automatentheorie. Es erleichtert das Ermitteln der mengentechnischen Beschreibung, der von einem Nichtdeterministischen endlichen Automaten (NEA) akzeptierten Sprache:
Betrachtet wird ein NEA , dessen Zustände mit den natürlichen Zahlen von 1 bis n bezeichnet sein sollen (also ). Zusätzlich werden folgende Definitionen herangezogen:
Mit Hilfe dieser Mengen lässt sich die Teilsprache jedes Zustands angeben:
Durch die Definition von Lq erhält man ein Gleichungs-System mit n Gleichungen:
Nun bringt man eine Teilsprache auf eine geeignete Form, welche eine Anwendung des Lemmas ermöglicht:
Laut Arden's Lemma ist diese Aussage äquivalent zu folgender:
Diese Lösung ist eindeutig. Setzt man nun Lq in alle anderen Gleichungen ein, so erhält man ein Gleichungs-System mit einer Variable weniger und kann so auf diese Weise immer weiter bis zum trivialen Fall vereinfachen, bei dem nur noch eine Gleichung übrig ist, welche man unabhängig von allen anderen Teilsprachen lösen kann. Durch Rückwärts-Einsetzen erhält man dann auch die übrigen Teilsprachen um schlussendlich die eindeutige Lösung des gesamten Gleichungs-Systems zu ermitteln und mit Li die vom Automaten akzeptierte Sprache zu identifizieren.
Algebraische Betrachtung
Aus Sicht der abstrakten Algebra stellt die Struktur eines Dioids dar, was heißt, dass sowohl als auch einen Monoiden bilden und distributiv über ist. Das neutrale Element bezüglich der Vereinigung ist die leere Menge und das neutrale Element bezüglich der Konkatenation ist . Aufgrund der fehlenden Invertierbarkeit ist es im Allgemeinen nicht möglich Gleichungen über dieser Struktur zu lösen. Das Lemma von Arden ermöglicht es aber zumindest die Lösungen einiger spezieller Gleichungen zu ermitteln und das sogar eindeutig.
Beispiele
Einfache Beispiele
Komplex-Beispiel
Man erhält damit das folgenden Gleichungs-System:
Durch die Anwendung des Lemmas erhält man schrittweise die Lösung:
Da S0 der Startzustand von ist, gilt , was der dem regulären Ausdruck (1 + 01 * 0) * + (0 + 10 * 1) * zugeordneten Sprache entspricht.Siehe auch
Kategorie:- Theorie formaler Sprachen
Wikimedia Foundation.