Auszeichnungssprache XML (Extensible Markup Language)

„Dokumente sind strukturierte Mengen von Informationen, die zur Wahrnehmung durch den Menschen bestimmt sind und als Einheit ausgetauscht werden können zwischen Systemen und/oder Benutzern.“ (Definition 'Dokument' laut ISO/IEC 8613: Information technology - Open Document Architecture)

Diese Definition enthält die drei Sichtweisen auf ein Dokument:

  • die Informationen bilden den eigentlichen Inhalt des Dokuments,
  • die Struktur beschreibt die Gliederung der Informationen sowie deren Beziehung
    untereinander (interne Organisation),
  • über das Layout, der visuellen Darstellung der Informationen, nimmt der
    Betrachter den Informationsgehalt wahr.

Jedoch: ein Dokument als Einheit von Inhalt, Struktur und Präsentation kann in der Regel nicht automatisch weiterverarbeitet werden. Ein Rechner versteht weder den Inhalt, noch kann er sich über das Layout der Dokumente orientieren wie ein menschlicher Betrachter. Die einzige Sichtweise, die für einen Rechner verständlich ist, ist die interne Organisation der Dokumente.

Das wesentliche Merkmal strukturierter Dokumente ist die Trennung der drei Sichtweisen voneinander. Bei strukturierten Dokumenten steht die Gliederung der Informationen im Vordergrund, nicht die Information selbst oder ihre Präsentation. Erst durch diese Trennung wird eine automatische Weiterverarbeitung möglich. Die Darstellung der Informationen ist Sache der verarbeitenden Applikation, beispielsweise eines Browsers für Online-Dokumente oder einer layoutorientierten Anwendung für Print-Dokumente. Die Komponenten sind unabhängig von der Plattform und den verwendeten Anwendungsprogrammen. Einzelne Abschnitte können in mehreren Dokumenten gleichzeitig verwendet werden, indem man entsprechende Teile der Struktur wiederverwendet. Der Inhalt des Abschnitts liegt nur einmal vor, Redundanz wird vermieden.

Ein Lösungsansatz für dieses Ziel ist die Auszeichnungssprache XML – die "Extensible Markup Language". Bei XML handelt es sich um einen Standard, mit dem Dokumentstrukturen beschrieben werden können, d.h. mit der Sprache XML kann man die hierarchische Struktur seiner Dokumente vorgeben. Mit dieser Eigenschaft wird XML u. a. für den plattform- und implementationsunabhängigen Austausch von Daten zwischen Computersystemen eingesetzt, insbesondere über das Internet.

  

Download "XML contra SGML"

Download!

Auszug aus der Diplomarbeit: Technologien zur Strukturierung von Informationen. 10 Seiten, Juli 2002 (PDF, 47 KB).

Download "Herausforderung Informationsmodellierung mit XML"

Download!

Größtenteils unverwendeter Auszug aus der Diplomarbeit: Grundlagen zur Strukturierung von Dokumenten durch DTD's. 20 Seiten, Juli 2002 (PDF, 65 KB).

Download Schulungsfolien "XML?"

Download!

Foliensatz zu einer Schulung zum Thema SGML und XML (allgemeine Entwicklung, Bedeutung, Unterschiede, Konzepte).
20 Seiten, überarbeitete Version, Juli 2004 (PDF, 35 KB).

Download Schulungsfolien "XML und XSL/XSLT - Eine (komprimierte) Einführung"

Download!

Foliensatz zu einer Schulung zum Thema XML, XSL/XSLT und zum Transformationsprozess (mit Beispiel, nicht selbsterklärend).
40 Seiten, Juli 2004 (PDF, 610 KB).