XML
[Abk. für Extensible Markup Language, dt. »erweiterbare Beschreibungssprache«], eine Sprache, mit der die Struktur von Dokumenten beschrieben wird (eine sog. Metasprache). XML ist eine eingeschränkte Form (man sagt auch: eine Untermenge) von SGML. Ein XML-Dokument ist medien- und plattformneutral, es kann unter allen Betriebssystemen bearbeitet und sowohl auf einem Drucker als auch in elektronischer Form, auf einer CD-ROM oder im Internet, ausgegeben/publiziert werden. Diese neutrale Form von XML-Dokumenten macht ihren Hauptvorteil aus.
Für die Ausgabe müssen die XML-Strukturbeschreibungen mit zusätzlichen Formatbeschreibungen versehen werden. Dies geschieht praktisch immer durch eine Konvertierung, für die es Standardverfahren gibt und die wegen der einheitlichen Struktur eines XML-Dokuments in der Regel unproblematisch abläuft. Erst nach der Konvertierung kann das Dokument mit allen typographischen Merkmalen auf dem Drucker, dem Bildschirm oder im World Wide Web ausgegeben werden.
Die Entwicklung von XML wurde 1996 vom W3C begonnen, 1998 wurde die Sprache als neuer Standard vorgestellt.
XML-Dokumente sind - wie bei HTML und SGML - reine ASCII-Dokumente (ASCII), die sich im Prinzip mit jedem Editor öffnen und bearbeiten lassen; es empfiehlt sich allerdings, nur spezielle XML-Editoren zu verwenden, weil diese über angepasste Editierfunktionen verfügen. Um ein XML-Dokument zu strukturieren, wird es in einem solchen Editor ausgezeichnet, d. h., die verschiedenen Inhaltskomponenten (Überschriften, Absätze usw.) werden mit Codes versehen. Das Auszeichnen (engl. markup) wird auch Taggen (Tag) genannt. Das Taggen geschieht üblicherweise auf der Basis einer sog. Dokumenttypdefinition (Abk. DTD), in der die grundsätzliche Struktur eines Dokuments vor der Arbeit im Editor festgelegt wird. Während SGML eine solche DTD immer voraussetzt, ist es bei XML erlaubt, auch ohne DTD zu arbeiten.
XML ist vor allem für Anwendungen im Internet, also letztlich im World Wide Web (WWW), entwickelt worden. Damit Dokumente im WWW veröffentlicht werden können, müssen sie im HTML-Format vorliegen, d. h. jedes XML-Dokument muss zunächst in HTML umgewandelt werden. Man kann sich fragen, weshalb nicht gleich in HTML gearbeitet wird. Der Unterschied zwischen HTML (das ebenfalls eine Untermenge von SGML ist) und XML besteht darin, dass HTML keine Strukturen beschreibt, sondern nur die Formatierung von Daten, außerdem lässt HTML die Erstellung neuer Tags nicht zu. XML dagegen ist erweiterbar, d. h. der Entwickler kann (in einem gewissen Rahmen) Tags definieren, die auf bestimmte Dokumente zugeschnitten sind und die die Auszeichnung des Dokuments erleichtern.
XML ist ideal geeignet, um Datenbankinhalte im Internet abzufragen und darzustellen, insbesondere, wenn es um große Textmengen geht. Daher bildet XML die Grundlage für moderne Content Management Systeme.
Es existieren Standarderweiterungen der Basissprache, die ebenfalls vom W3C herausgegegeben wurden:
- Durch XLink ist es beispielsweise möglich, Verknüpfungen zwischen zwei oder mehreren XML-Dokumenten herzustellen, wobei ein Link - ähnlich wie in HTML - in das Innere des neuen Dokuments zielen darf, dass nun als Teil des bereits vorhandenen Dokuments dargestellt wird.
- Ähnlich wie CSS unter HTML, dient XSL (Abk. für Extensible Stylesheet Language, dt. »erweiterbare Sprache für Formatvorlagen«) dazu, die Darstellung von Dokumenten zu steuern, also Anzeigeformate vorzugeben. Mit XSL ist es z. B. möglich, alle Formate für die parallele Ausgabe eines XML-Dokuments auf einem Computermonitor und einem Handy festzulegen.
- Das Document Object Model (Abk. DOM) ist eine Schnittstelle zwischen Anwendungsprogrammen und XML-Dokumenten, die es gestattet, den Inhalt von XML-Dokumenten dynamisch zu aktualisieren. Das ist besonders hilfreich beim Zusammenspiel zwischen Datenbanken und XML-Dokumenten.
- VoiceXML regelt den sprachgesteuerten Zugriff auf Webinhalte, etwa über Telefon oder für Sehbehinderte.