- JAXP
-
Das Java API for XML Processing, oder JAXP, ist eines der Java-XML-APIs. Enthalten ist eine Reihe von Möglichkeiten zum Validieren und Parsen von XML-Dokumenten. Die drei grundlegenden Schnittstellen sind:
- das Document Object Model Parser-Schnittstelle oder DOM-Schnittstelle
- das Simple API for XML Parser-Schnittstelle oder SAX-Schnittstelle
- das Streaming API for XML oder StAX-Schnittstelle (hinzugefügt in JDK 6; separat als Jar verfügbar für JDK 5)
Weiterhin bietet die API eine XSLT-Schnittstelle an, um Transformationen an Daten und Strukturen eines XML-Dokuments zu ermöglichen.
Das J2SE 1.4 JDK war die erste JDK-Version, die mit einer Implementierung der JAXP 1.1 veröffentlicht wurde, die aktuelle J2SE wird mit dem Apache Xerces Parser ausgeliefert.
Inhaltsverzeichnis
DOM-Schnittstelle
Die DOM-Schnittstelle ist sehr einfach aufgebaut. Sie parst ein ganzes XML-Dokument und erstellt eine vollständige „in memory“-Darstellung des Dokuments. Dabei benutzt es die Klassen und Konzepte der Spezifikation, die unter Document Object Model(DOM) Level 2 Core Specification[1] einsehbar ist.
Der DOM-Parser wird DocumentBuilder genannt, da er eine in-memory-Dokumentendarstellung liefert. Eine Instanz der Klasse javax.xml.parsers.DocumentBuilder wird durch die Factory-Klasse javax.xml.parsers.DocumentBuilderFactory erzeugt. Der DocumentBuilder erstellt zunächst eine org.w3c.dom.Document-Instanz in Form einer Baumstruktur, die die Knoten im XML-Dokument enthält. Jeder Baumknoten in dieser Struktur implementiert die org.w3c.dom.Node-Schnittstelle. Es gibt viele verschiedene Typen von Baum-Knoten, die die jeweiligen Datentypen aus dem XML-Dokument repräsentieren.
Die wichtigsten Knoten sind:
- Elementknoten, eventuell mit Attributen
- Textknoten, die den gefundenen Text zwischen Start- und End-Tag eines Dokumentelementes widerspiegeln
Für eine komplette Liste der Knotentypen wird auf die javadoc Documentation des Paketes org.w3c.dom verwiesen.
Mit dem DOM-API kann man 'in beide Richtungen' arbeiten, also vom XML zum "in memory" DOM als auch vom DOM zum XML. Es eignet sich also nicht nur zum "parsen" von XML sondern auch zum Generieren von XML (-Streams oder -Files).
SAX-Schnittstelle
Der SAX-Parser, auch SAXParser genannt, wird durch javax.xml.parsers.SAXParserFactory erstellt. Im Gegensatz zum DOM-Parser erstellt der SAXParser keine "in-memory"-Darstellung eines XML-Dokumentes, was ihn folglich schneller und weniger anspruchsvoll im Speicherverbrauch macht. Hingegen informiert der SAXParser den Client der XML-Dokumenten-Struktur durch Rückruffunktionen (Callbacks), d. h. es werden Methoden der DefaultHandler-Instanz, die dem Parser zur Verfügung stehen, ausgeführt.
Die DefaultHandler-Klasse befindet sich im Paket org.xml.sax.helpers. Diese implementiert den ContentHandler, den ErrorHandler, den DTDHandler und die EntityResolver-Schnittstelle. Die meisten Clients interessieren sich für die Methoden aus der ContentHandler-Schnittstelle.
Die ContentHandler-Methoden, implementiert durch den DefaultHandler, werden aufgerufen, sobald der SAX-Parser auf die entsprechenden Elemente des XML-Dokumentes trifft. Die wichtigsten Methoden in dieser Schnittstelle sind:
- die startDocument() und endDocument()-Methode, die am start- und am end-tag eines XML-Dokumentes aufgerufen werden.
- die startElement() und endElement()-Methode, die am start- und am end-tag eines Dokumentelementes aufgerufen werden.
- die characters()-Methode. Diese wird mit dem Inhalt, der sich zwischen start- und end-tag des jeweiligen XML-Dokumentelements befindet, aufgerufen.
Der Client bietet eine Unterklasse des DefaultHandlers an, der diese Methoden überschreibt und die Daten verarbeitet. Dies kann auch das Ablegen der Daten in eine Datenbank oder das Schreiben in einen stream beinhalten.
Mit dem SAX-API kann man 'nur in eine Richtung' arbeiten, und zwar vom XML 'hinein' in Java. Es eignet sich also ausschliesslich zum "parsen" von XML. Mit SAX kann man also kein XML (-Streams oder -Files) erzeugen.
XSLT-Schnittstelle
Die XML Stylesheet Language for Transformations, abgekürzt XSLT, erlaubt die Konvertierung eines XML-Dokumentes in andere Formen von Daten.
XSD-Validierung
Validierung von XSD-Dateien wird ab Version 1.2 unterstützt. Die Version 1.2 ist erst nach der Version 1.4 in J2SE und ab der Version 1.4 in J2EE enthalten.
Einzelnachweise
Weblinks
- Sun's JAXP Produktbeschreibung
- Beispielprogramm, das den DOM Parser und den SAX Parser benutzt Tutorial: XML with Xerces for Java
Wikimedia Foundation.