- Greibach-Normalform
-
Die Greibach-Normalform ist ein Begriff der theoretischen Informatik, der im Zusammenhang mit kontextfreien Sprachen von Interesse ist. Sie ist nach der US-Informatikerin Sheila A. Greibach benannt und beschreibt eine Normalform der kontextfreien Grammatiken. Jede kontextfreie Grammatik, nach der nicht das leere Wort abgeleitet werden kann, kann in eine Greibach-Normalform transformiert werden. Die herausragende Eigenschaft der Greibach-Normalform ist, dass bei jedem Ableitungsschritt jeweils genau ein Terminalzeichen entsteht. Damit ist sie der natürliche Zwischenschritt bei der Umformung einer kontextfreien Grammatik in einen äquivalenten nichtdeterministischen Kellerautomaten ohne ε-Übergänge.
Eine weitere Normalform für kontextfreie Grammatiken ist die Chomsky-Normalform.
Inhaltsverzeichnis
Formale Definition
Sei G eine kontextfreie Grammatik (vgl. Chomsky-Hierarchie), also , mit . Dabei sei N die Menge der Nichtterminalsymbole, Σ die Menge der Terminalsymbole, P die Menge von Produktionsregeln und S das Startsymbol. Sei das leere Element .
G ist in Greibach-Normalform (kurz GNF), wenn alle Produktionen aus P die Form mit haben, wobei b ein Terminalsymbol ist und A und Bi für Nichtterminale sind. Mit erhält man eine reguläre Grammatik als Spezialfall einer kontextfreien Grammatik in Greibach-Normalform.
Für alle mit gibt es ein , mit , in Greibach-Normalform.
Ist allerdings , dann darf S nie auf der rechten Seite einer Produktion vorkommen. Somit ist gewährleistet, dass auch Sprachen, die das leere Wort enthalten, von einer Grammatik in Greibach-Normalform erzeugt werden können.
Konstruktion der GNF
Ausgehend von der Chomsky-Normalform gibt es folgenden Algorithmus zur Überführung einer Grammatik in die Greibach-Normalform. Hierbei sind Nichtterminale, Folgen von Nichtterminalen, Terminale und die Menge der Variablen.
Einsetzen der Produktionen
Gibt es eine Regel der Form mit i > j, muss sie ersetzt werden.
Beispiel: mit wird zu .
Diese Ersetzung fangen wir beim höchsten i an und arbeiten uns bis zur 1 nach unten.
Ersetzen von linksrekursiven Regeln
Linksrekursive Regeln haben die Form , d.h eine Variable kann wieder auf sich selbst ableiten. Durch den vorherigen Schritt des Algorithmus' ist gesichert, dass entweder mit einem Terminal oder einem beginnen.
Durch wiederholtes Einsetzen sieht man leicht, dass durch linksrekursive Regeln genau der Reguläre Ausdruck
erzeugt werden kann. Dieser kann leicht simuliert werden:
Ersetze die Regeln für Ai mit:und füge neue Regeln für Bi ein:
.
Ab jetzt gibt es nur noch Regeln der Form
Entfernen der Regeln, die mit einem Nichtterminal beginnen
Jetzt können wir in allen Regeln, die zuerst auf ein Nichtterminal ableiten, die Produktionen dieses Nichtterminals einsetzen.
Ab jetzt gibt es nur noch Regeln der Form .
Weiter bis Ende
Nun werden die Konstruktionsregeln auf alle Regeln von B analog angewandt.
Eine strengere Variante der Greibach-Normalform
Es ist auch möglich, die Produktionen einer kontextfreien Grammatik so in Greibach-Normalform umzuformen, dass auf jeder rechten Seite maximal 2 Variablen vorkommen. Die resultierenden Produktionen haben dann also die Form , oder .
Konstruktion eines Kellerautomaten aus der GNF
Um aus einer Grammatik G = (N,T,P,S) in GNF einen Kellerautomaten M = (Z,Σ,Γ,δ,q0,Z0,F) zu konstruieren, wähle die Zustandsmenge von M als Z = {q0}, das Kelleralphabet Γ = N, das Bandalphabet Σ = T, das Kellerstartsymbol Z0 = S und die Menge der Endzustände . Als Übergangsrelation wähle . M akzeptiert über leeren Keller. Beweis per Induktion[1].
Literatur
- Uwe Schöning: Theoretische Informatik - kurzgefasst. 4. Auflage. Spektrum, Heidelberg u. a. 2001, ISBN 3-8274-1099-1.
Einzelnachweise
Kategorien:- Automatentheorie
- Compilerbau
- Theorie formaler Sprachen
Wikimedia Foundation.