- SGML
-
Standard Generalized Markup Language Dateiendung keine MIME-Type application/sgml, text/sgml
Art Metasprache Erweitert von GML Erweitert zu HTML, XML Standard(s): ISO 8879 DIN EN 28879 Bereich Informationsverarbeitung Regelt Text- und Bürosysteme Kurzbeschreibung Genormte Verallgemeinerte Auszeichnungssprache (SGML) Letzte Ausgabe 3.1991 ISO ISO 8879:1986 Information Processing — Text and Office Systems — Standard Generalized Markup Language (SGML) Standard Generalized Markup Language (SGML, engl., dt. Normierte Verallgemeinerte Auszeichnungssprache) ist eine Metasprache, mit deren Hilfe man verschiedene Auszeichnungssprachen (engl. markup languages) für Dokumente definieren kann. SGML ist ein ISO-Standard: ISO 8879:1986 Information Processing — Text and Office Systems — Standard Generalized Markup Language (SGML). SGML ist weiterhin in der Europäischen Norm EN 28879:1990 und der DIN EN 28879:1991 beschrieben.
Inhaltsverzeichnis
Inhalt und Darstellung
Um ein gültiges (engl. valid) Dokument in SGML zu beschreiben, wird die Dokumenttypdefinition verwendet (DTD), die den strukturellen Aufbau von Dokumenten beschreibt.
In SGML sind der Inhalt des Dokuments und das Layout voneinander getrennt (d. h. voneinander unabhängig angebbar), wobei ersteres durch SGML-Elemente strukturiert wird.
Zur Wiedergabe dieser Struktur auf einem bestimmten Ausgabemedium wurde die Sprache Document Style Semantics and Specification Language (DSSSL) entwickelt. Eine Überschrift wird also in SGML zwar mit einem sogenannten Markup gekennzeichnet; wie diese bei der Ausgabe dargestellt wird, ist für SGML unerheblich.
Die Gültigkeit des Dokumentes überprüft man mit so genannten Parsern. SGML-Parser lesen zunächst die SGML-Deklaration und die DTD ein und prüfen dann, ob das eigentliche Dokument konform mit Deklaration und DTD ist. Ein solcher Parser ist beispielsweise nsgmls von James Clark; dieser Parser wird im Rahmen des OpenSP-Projektes weiterentwickelt.
Abgrenzung
Die bekanntesten auf SGML basierenden Sprachentwicklungen sind HTML und XML. Sie werden oft als Ableitungen beziehungsweise als Dialekte von SGML beschrieben. HTML ist eine Anwendung (engl. application) von SGML und XML eine bestimmte Untermenge von SGML. In der Praxis hat XML heute den Platz von SGML eingenommen und wird in breitem Umfang verwendet.
Bekannte SGML-Sprachelemente
Neben den Tags in spitzen Klammern leben folgende ursprünglich von SGML eingeführten Sprachelemente heute noch in HTML bzw. XML weiter:
- Dokumenttypdefinitionen (DTDs)
- Dokumenttypdeklarationen, z.B.
<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 4.0//DE">
- Zeichenreferenzen:
<
&
ä
... - CDATA-Abschnitte der Form
<![CDATA[Inhalt]]>
- Kommentare:
<!--Kommentar-->
Geschichte
Einer der Väter von SGML ist Charles Goldfarb, der die Grundlagen für IBMs Document Composing Facility Generalized Markup Language (IBM GML oder DCF GML) definierte. Ziel der GML war es, Dokumente so zu beschreiben, dass das Ergebnis weder von einer bestimmten Plattform noch von einer spezifischen Anwendung abhing. Es ging dabei rein um die logische Struktur wie z. B. die Einteilung eines Buches in Überschriften, Kapitel, Abschnitte und nicht um das Aussehen eines Dokumentes. Diese wesentliche Idee, das Konzept des generic coding, ist bereits Ende der 1960er Jahre entstanden und geht auf William W. Tunnicliffe zurück. Im Lauf der Jahre wurde GML weiterentwickelt und setzte sich letztendlich 1986 als internationaler Standard ISO 8879:1986 Standard Generalized Markup Language – SGML durch.
Behörden, Firmen, Bildungseinrichtungen und Institutionen begannen damit, ihre Daten in SGML zu speichern. Den großen Durchbruch auf breiter Front schaffte SGML aber nicht.
Siehe auch
Anwendungen
- HTML, Standard zur Strukturierung von Webseiten
- DocBook, Standard zur Erstellung von (technischer) Dokumentation
- TEI, Dokumentformat zur Kodierung und für den Austausch von Texten
- EAD, Standard zur Beschreibung von Findbüchern und anderen Findhilfen in Archiven
Die aufgeführten Anwendungen werden heute zumeist auf Basis von XML weiterentwickelt.
Literatur
- Charles F. Goldfarb: The SGML Handbook, Oxford University Press (1991), ISBN 0-19-853737-9
- Horst Szillat: SGML: Eine Einführung, International Thompson Publishing (1995), ISBN 3-929821-75-3
Weblinks
- Überblick über SGML-Ressourcen (englisch)
- Charles Goldfarb: The Roots of SGML (englisch)
- Comparison of SGML and XML (englisch)
Wikimedia Foundation.