- XSL Transformations
-
XSL Transformations Dateiendung .xsl, .xslt
MIME-Type application/xslt+xml[1]
Entwickelt von World Wide Web Consortium Art Stylesheet-Sprache Erweitert von XML Standard(s): 1.0 (Recommendation),
2.0 (Recommendation)XSL Transformation, kurz XSLT, ist eine Programmiersprache zur Transformation von XML-Dokumenten. Sie ist Teil der Extensible Stylesheet Language (XSL) und stellt eine turing-vollständige[2][3] Sprache dar.
XSLT baut auf der logischen Baumstruktur eines XML-Dokumentes auf und dient zur Definition von Umwandlungsregeln. XSLT-Programme, sogenannte XSLT-Stylesheets, sind dabei selbst nach den Regeln des XML-Standards aufgebaut.
Die Stylesheets werden von spezieller Software, den XSLT-Prozessoren, eingelesen, die mit diesen Anweisungen ein oder mehrere XML-Dokumente in das gewünschte Ausgabeformat umwandeln. XSLT-Prozessoren sind auch in vielen modernen Webbrowsern integriert, so Opera (ab Version 9), Firefox, Internet Explorer Version 5 (erst seit Version 6 mit vollständiger XSLT-1.0-Unterstützung) oder Mozilla.
XSLT ist eine Untermenge von XSL, zusammen mit XSL-FO und XPath.
Inhaltsverzeichnis
Geschichte
Ursprünglich sollte mit XSL eine DSSSL-artige Sprache in XML-Syntax entstehen. Schnell war jedoch klar, dass eine solche Sprache eigentlich aus drei interagierenden, aber unabhängig voneinander einsetzbaren Teilen besteht:
- Einer Sprache für die Beschreibung eines Dokuments als Baum mit Formatierungsanweisungen und Stilangaben: XSL Formatting Objects (XSL-FO)
- Einer Sprache für die Transformation eines beliebigen XML-Dokuments in einen anderen Baum, z. B. einen in XSL-FO: XSLT
- Einer Sprache für die Adressierung von Baumbestandteilen: XPath
Die deklarative, funktional-applikative Sprache XSLT ist u. a. aus DSSSL hervorgegangen. Entwickelt wurde XSLT ursprünglich von James Clark (XSLT 1.0, XSLT 1.1), für die derzeitige Weiterentwicklung ist Michael Kay verantwortlich. Seit dem 23. Januar 2007 ist XSLT 2.0 eine „Recommendation“ (Empfehlung) des W3C und hat damit die seit 1999 gültige Version XSLT 1.0 abgelöst.
Funktionsweise
Die Sprache XSLT beschreibt die Umwandlung eines XML-Derivats (auch XML-Dialekt oder XML-Anwendung genannt), in Form eines XML-Dokuments, in ein anderes Dokument, Transformation genannt. Das resultierende Dokument entspricht meist der XML-Syntax, es können aber auch andere Textdateien und sogar Binärdateien erstellt werden.
Dazu werden die XML-Dokumente als logischer Baum betrachtet: Die Quellbäume der zu transformierenden Dokumente und die durch die Transformation entstehenden Zielbäume der zu erzeugenden Dokumente.
Eine Transformation besteht aus einer Reihe von einzelnen Transformationsregeln, die Templates (deutsch „Schablonen“) heißen. Ein Template besitzt ein auf XPath basierendes Pattern (deutsch „Muster“), das beschreibt, für welche Knoten es gilt, und einen Inhalt, der bestimmt, wie das Template seinen Teil des Zielbaums erzeugt.
In einem XSLT-Dokument kommen also an Sprachen und XML-basierten Technologien mindestens vor:
- XML als Basis für XSLT
- XSLT selbst (XML-basiert)
- XPath / XSLT Patterns
- Die Sprache(n) des Quell-Dokuments (XML-basiert, z. B. DocBook)
- Die Sprache(n) des Ziel-Dokuments (häufig XML-basiert, z. B. XHTML (ab XSLT 2.0), XML, XSLT selbst, aber auch HTML oder RELAX NG, Text-Format auch möglich)
- XML Namespaces zur Unterscheidung der einzelnen verwendeten Sprachen
Sowie ab XSLT 2.0:
- „XML-Schema“-Datentypen
- XHTML
Template Rules und Conflict Resolution
Template Rules (deutsch „Schablonen-Regeln“) werden immer dann angewendet, wenn eine bestimmte Bedingung passt. Das folgende Beispiel schließt den Inhalt aller Titel („title“-Tags) in „em“-Tags ein, egal wo sie im Dokument vorkommen, und lässt den Rest unberührt.
<xsl:template match="//title"> <em> <xsl:apply-templates/> </em> </xsl:template>
„
<xsl:apply-templates/>
“ transformiert das aktuelle Element mittels sämtlicher dafür anwendbarer Regeln.Conflict Resolution (deutsch „Konfliktauflösung“) wird dann benötigt, wenn ein Knoten zu mehreren Template Rules gleichzeitig passt. In solchen Fällen gelten die folgenden Regeln.
- Importierte Regeln haben niedrigere Priorität.
- Wenn ein Attribut priority gegeben ist, wird es berücksichtigt.
- Spezifischere Patterns haben höhere Priorität als weniger spezifische. So ist beispielsweise der Test, ob irgendein Knoten existiert, weniger spezifisch als ein Test für einen Knoten mit konkretem Namen.
- Wenn es mehrere gleichberechtigte Regeln gibt, ist das ein Fehler, und wird vom XSLT-Parser als Meldung ausgegeben.
Sortierung und bedingte Ausgabe
Um Elemente zu sortieren, kann ein „
for-each
“-Tag mit einem „sort
“-Tag kombiniert werden. Die Schleife läuft dann nicht in der Reihenfolge der Knoten des Originaldokuments sondern in alphabetischer oder numerischer Reihenfolge. Im folgenden Beispiel werden alle Buch-Elemente aufsteigend nach ihrem Preis sortiert.<xsl:for-each select="buch"> <xsl:sort select="preis" /> </xsl:for-each>
XSLT bietet sowohl binäre Entscheidungen mittels des „
if
“-Tags als auch mehrfache Entscheidungen über das „choose
“-Tag. Das folgende Beispiel gibt genau dann ein Sternchen aus, wenn das Attribut „nationality
“ des Elements „author
“ den Wert „U.S.“ hat.<xsl:if test="author/@nationality='U.S.'">*</xsl:if>
Um mehrere Fallunterscheidungen zu treffen, kann die Kombination aus „
choose
“- und „when
“-Tags verwendet werden.<xsl:choose> <xsl:when test="...">...</xsl:when> <xsl:when test="...">...</xsl:when> <xsl:when test="...">...</xsl:when> <xsl:otherwise>...</xsl:otherwise> </xsl:choose>
Text unverändert ausgeben
Um durch XSLT beliebigen Text ausgeben zu lassen, kann das Tag „<xsl:text>“ verwendet werden, wobei das Escaping (die Ausgabe von „<“ und „&“ als „<“ und „&“) abgeschaltet werden kann. Der Inhalt kann als normaler Text oder in einem CDATA-Abschnitt stehen. Der Vorteil des CDATA-Abschnitts besteht darin, dass sein Inhalt nicht interpretiert wird, er kann also auch XML-Syntax enthalten.
Zum Beispiel erzeugt
<xsl:text disable-output-escaping="yes"> <![CDATA[ ### Hier darf < & >>< beliebiger Text stehen ### ]]> </xsl:text>
die Ausgabe:
### Hier darf < & >>< beliebiger Text stehen ###
Anwendungen
Zwei wichtige Anwendungsgebiete für XSLT sind:
- POP (Presentation Oriented Publishing) bezeichnet die Transformation zum Zwecke der Darstellung. Mit unterschiedlichen Stylesheets können die Daten in XHTML, Formatting Objects (XSL-FO), SVG, SMIL, DocBook und viele andere Formate umgewandelt werden. Das Zieldokument muss hierbei nicht zwingend ein XML-Dokument sein. Das ursprüngliche semantische Markup wird dabei durch ein Stil-bezogenes Markup ersetzt.
- MOM (Message Oriented Middleware) bezeichnet die Transformation zum Zwecke des Datenaustausches. Da XML lediglich ein Sprachkonzept zur Entwicklung von Sprachen bildet, genügt es nicht, dass zwei Systeme (z. B. Programme) XML beherrschen, um gegenseitig Daten austauschen zu können. Sie müssen die gleiche XML-basierte Sprache verwenden. In dem häufigen Fall, in dem die Systeme nicht die gleiche XML-basierte Sprache verwenden, wird gerne XSLT eingesetzt, um mit Hilfe von Transformationen Übersetzer von der einen Sprache in die andere zu entwickeln.
Beispiele für POP sind etwa:
- Statistische Daten liegen als XML vor (z. B. aus der Datenbank) und werden mit Hilfe unterschiedlicher Transformationen aufbereitet als
- Vektorgrafik in SVG
- Text
- Tabelle in XHTML
- PDF (über den Zwischenschritt XSL-FO) oder auch
- Excel-Tabelle (durch SpreadsheetML ab Office XP).
- Für eine Website werden die XHTML-Dateien oder XML-Dateien erstmals ohne Layout geschrieben und erhalten anschließend das Layout mit Hilfe einer Transformation. Der Vorteil ist dabei ähnlich dem eines klassischen CMS: Um das Layout zu ändern, ist es nicht notwendig, alle XHTML-Seiten zu ändern; stattdessen ändert man das Stylesheet und transformiert neu. Beispielsweise verwendet das XML Publishing System Apache Cocoon dieses Verfahren.
Alternativen zu XSLT
DSSSL
Eine mögliche Alternative zu XSLT ist DSSSL, das man auch als Vorläufer von XSLT betrachten kann. Der wohl größte Vorteil von XSLT gegenüber DSSSL ist seine XML-basierte Syntax. Somit kann jeder XML-Editor automatisch auch für XSLT eingesetzt werden, außerdem gelten die Syntax-Regeln von XML (Wohlgeformtheit, Gültigkeit) damit auch für XSLT. Dadurch ist es möglich, dass XSLT sich selbst bearbeitet, man kann also Transformationen zur Erzeugung und Bearbeitung von Transformationen entwickeln.
MetaMorphosis
MetaMorphosis ist ebenfalls von DSSSL inspiriert. Im Gegensatz zu XSLT ist es ein „target driven“ (zielgesteuerter) Prozessor. Dabei wird der zu erstellende Zielbaum konstruiert. Die Regeln beschreiben nicht, wie die Eingabedatei verarbeitet werden soll, sondern, wie die Ausgabedatei konstruiert werden soll. Der Prozess beginnt mit einer virtuellen Regel „!begin“ mit der der Transformationsprozess beginnt. Die Transformationsregeln beschreiben, wie die Knoten gefüllt werden sollen. Dabei werden Abfragen in die Quellbäume wie auch in die bis dahin aufgebauten Zielbäume formuliert. Die Abfragesprache ist ein mengenorientierter Ausdruck, der alle Eigenschaften der Knoten auslesen und auch setzen kann. Erzeugte Knoten können nachträglich beliebig manipuliert werden.
Weitere Merkmale von MetaMorphosis unterstützen den industriellen Einsatz: flexible Speicherverwaltung für sehr große Dokumente, Aufbau von Hilfsdatenstrukturen (getindex, putindex) zum schnellen Zugriff, Plugin-Architektur, API für C++, C#, Java, die Möglichkeit dedizierte Frontends und Backend zu implementieren (in C++ wie auch in der MetaMorphosis-Skriptsprache).
Template Attribute Language
Im Rahmen des Anwendungsservers Zope wurde die Template Attribute Language (TAL) entwickelt; TAL-Templates sind (je nach Ausgabeformat) [X]HTML- oder XML-Dokumente, deren Inhalte durch Attribute dynamisch ersetzt werden können, und die damit Prototyp und verwendetes Template vereinen. Dem Element
<xsl:for-each>
entspricht etwa das Attributtal:repeat
; als Ausdruckssyntax wird die TAL Expression Syntax verwendet. Wenn sich kein HTML- oder XML-Element als Träger des Attributs anbietet, können auch<tal:bel.Bezeichner>
-Elemente verwendet werden.Generische Programmiersprachen
Eine grundsätzliche Alternative zu XSLT besteht in der Möglichkeit, solche Transformationen in jeder beliebigen Programmiersprache (z. B. Java, C++ oder Perl) abzufassen. XSLT kann dabei jedoch bei Einhaltung bestimmter Voraussetzungen eine gewisse Garantie für wohlgeformte und unter Umständen sogar gültige Zieldokumente gewähren. Außerdem ist die Entwicklung einer Transformation in XSLT in der Regel mit erheblich weniger Aufwand verbunden als die Entwicklung einer Transformation in einer generischen Programmiersprache.
Es ist auch möglich, beides zu koppeln: Die eigentliche Transformation geschieht dann per XSLT, jedoch werden innerhalb des XSLT-Stylesheets selbstdefinierte Funktionen zur Stringmanipulation aufgerufen. Das (z. B. in Ruby oder Python geschriebene) Programm besteht dann aus diesen selbstdefinierten Funktionen und dem Aufruf einer XSLT-Funktion, die den Stylesheet und die eigenen Funktionen als Parameter erhält.
CSS
Häufig wird CSS als Alternative zu XSLT genannt. CSS ist jedoch nur scheinbar eine Alternative zu XSLT, da es sich bei CSS lediglich um eine Formatierungssprache handelt. CSS beschreibt lediglich, wie die Bestandteile eines Baumes (akustisch oder visuell) zu formatieren sind, während XSLT den Baum radikal ändern kann oder als Ergebnis Dokumente liefern kann, die nicht auf XML basieren. So kann man mit XSLT z. B. automatisch Inhaltsverzeichnisse, Indizes, Link-Listen und komplexe Berechnungen erstellen, nicht jedoch mit CSS. Mit XSLT ist es zudem möglich, Ergebnisse zu erzeugen, die CSS als Formatierungssprache verwenden.
Code-Beispiel
Folgendes XSLT erzeugt ein einfaches Inhaltsverzeichnis für eine XHTML-Seite mit Überschriften:
<?xml version="1.0" encoding="iso-8859-1"?> <xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:html="http://www.w3.org/1999/xhtml" xmlns="http://www.w3.org/1999/xhtml" exclude-result-prefixes="html" > <xsl:output method="xml" doctype-system="http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd" doctype-public="-//W3C//DTD XHTML 1.1//EN" /> <xsl:template match="html:body"> <xsl:copy> <xsl:apply-templates select="@*"/> <h1><xsl:apply-templates select="//html:title//text()" /></h1> <h2 id="toc">Inhaltsverzeichnis</h2> <ul> <li><a href="#toc">Inhaltsverzeichnis</a></li> <xsl:for-each select=".//html:h2"> <li> <xsl:if test="not(@id)"> <xsl:message>Achtung: Kann ohne Id keinen Link erzeugen</xsl:message> </xsl:if> <a href="#{@id}"><xsl:apply-templates/></a> </li> </xsl:for-each> </ul> <xsl:apply-templates/> </xsl:copy> </xsl:template> <xsl:template match="node()|@*"> <xsl:copy> <xsl:apply-templates select="@*"/> <xsl:apply-templates/> </xsl:copy> </xsl:template> </xsl:stylesheet>
Siehe auch: XML, XSL-FO, XPath
XSLT-Prozessoren
Folgend eine Auflistung von bekannten XSLT-fähigen Prozessoren und Bibliotheken.
- Saxon (Java und .NET, nichtvalidierende Variante, frei)
- TransforMiiX (C++, frei)
- Xalan-Java (Java, frei)
- Xalan-C++ (C++, frei)
- libxslt/xsltproc (C, frei)
- xmlstarlet (C, multiplattform, frei)
- XT (Java, ursprünglich von James Clark, frei) http://www.jclark.com/xml/xt-old.html
- Sablotron (C++, multiplattform, frei)
- AltovaXML (COM, Java und .NET, Windows) http://www.altova.com/altovaxml.html
- Microsoft XML Core Services (Windows, nicht frei)
- .NET Framework 1.0/1.1 (System.Xml.Xsl.XslTransform) und 2.0/3.0/3.5 (System.Xml.Xsl.XslCompiledTransform)
- PHP 5 XSL Funktionen (PHP 5, basiert auf libxslt, frei)
- Unicorn XSLT Processor (Windows, nicht frei, nützliche Zusatzwerkzeuge)
Literatur
- Doug Tidwell: XSLT O’Reilly, ISBN 3-89721-292-7 (englisch)
- Michael Fitzgerald: Learning XSLT. O’Reilly, ISBN 0-596-00327-7 (englisch)
- Michael Kay: XSLT 2.0 Programmer's Reference Wrox Press, 2004, ISBN 0764569090 (englisch)
- Steven Holzner: Inside XSLT. New Riders, 2001, ISBN 0735711364 (englisch)
- E. R. Harold, W. S. Means: XML in a Nutshell. O’Reilly, ISBN 3-89721-339-7 (deutsch)
- Frank Bongers: XSLT 2.0 Handbuch Galileo Computing, 2005, ISBN 3-89842-361-1 (deutsch)
- Sal Mangano: XSLT Kochbuch O’Reilly 2006, ISBN 3-89721-457-1 (deutsch)
Weblinks
- XSL Transformations (XSLT) Version 1.0 (Normative Version) (englisch)
- XSL Transformations (XSLT) Version 1.0 (nicht offizielle Übersetzung)
- XSL Transformations (XSLT) Version 2.0 (englisch)
- XSLT-Einführung in die Transformationssprache
- Umfangreiche XSLT-Referenz
- Das XML-XSLT-Seminar, Kapitel XSLT – Einführung in XSLT
- Tutorial zum Thema XSLT
- SAXON-Dokumentation mit XSLT und XPATH-Beschreibung
- selfhtml.org – XSLT-Anleitung
- XSL FAQ (englisch)
- System.Xml.Xsl-Namespace im MSDN
Einzelnachweise
- ↑ http://www.w3.org/TR/xslt20/#xslt-mime-definition
- ↑ Unidex, Inc. Universal Turing Machine in XSLT. Unidex, Inc. (englisch)
- ↑ Korlyukov, Alexandr. (2001). Turing Machine. (englisch)
Standards des World Wide Web ConsortiumsEmpfehlungen (recommendations): Canonical XML | CDF | CGI | CSS | DOM | HTML | MathML | OWL | PLS | RDF | RDF-Schema | SISR | SMIL | SOAP | SRGS | SSML | SVG | SPARQL | Timed Text | VoiceXML | WSDL | XForms | XHTML | XML | XML Base | XML Events | XML Information Set | XML Schema | XML Signature | XPath | XPointer | XQuery | XSL Transformation | XSL-FO | XSL | XLink
Anmerkungen (notes): XHTML+SMIL | XAdES
Arbeitsentwürfe (working drafts): CCXML | CURIE | InkML | XFrames | XFDL | WICD | XHTML+MathML+SVG | XBL | XProc | HTML 5
Wikimedia Foundation.