Kurse für Kenner

XML-Kurs: Anwendung und Ausblick
Auszeichnungssprachen und das WWW

Das World Wide Web ist der jüngste Dienst des Internets. Im Herbst 1990 veröffentlichte Tim Berners-Lee am CERN das Hypertextsystem für das Internet. Hypertextsysteme ermöglichen es Verweise innerhalb eines Textes auf andere Dokumente anzulegen, so daß ein zusammenhängendes Netz entsteht.

Das System beruht auf drei Kern-Technologien:
  • Mittels HTTP (Hypertext Transfer Protocol)wird die Kommunikation zwischen Client und Server geregelt
  • Verweise werden mittels URIs (Universal Resource Identifier) adressiert
  • die eigentliche Webseite wird mit der Sprache HTML beschrieben.
Das World Wide Web verhalf dem Internet zu seinem großen Erfolg, vor allen auch außerhalb von Unternehmen und Forschungseinrichtungen. Im allgemeinen Sprachgebrauch werden deshalb Internet und World Wide Web schon fälschlicherweise synonym verwendet.

Um eine Standardisierung der Internet-Technologien zu erreichen gründete Tim Berners-Lee 1994 das World Wide Web Consortium, kurz W3C. Mittlerweile besteht das Gremium aus vielen namhaften Firmen und Organisationen. Ziel ist es Internetstandards zu entwickeln, die offen und frei von Patenten sind. Somit wird eine für das internationale Internet wichtige Plattformunabhängigkeit erreicht.

Neben HTML und XHTML wurde unter anderem auch SVG (Scalable Vector Graphics), eine auf XML basierende Sprache für Vektorgrafiken entwickelt, die bereits von vielen Programmen unterstützt wird.

HTML - Die Sprache des Netzes

Aufbau
Die HyperText Markup Language (HTML) wurde entwickelt um Seiten im WWW darzustellen. HTML ist eine SGML-Anwendung und beschreibt Layout und Inhalt einer Webseite. Es ist demnach eine Auszeichnungssprache zur Formatierung von Dokumenten.

Durch entsprechende Elemente können Größe, Schriftart, Farbe und Ausrichtung der Texte definiert werden. Verweise zu anderen Seiten können mit einem speziellen Element erstellt werden, wodurch das HyperText-System ermöglicht wird.

Die Darstellung eines solchen Dokuments in Codeform unterscheidet sich nicht grundlegend von einem XHTML-Dokument.

Probleme mit HTML
Die ursprüngliche Version sollte nur die Struktur einer Seite beschreiben und die Darstellung dem Web-Browser (Programm zur Darstellung von HTML-Dokumenten) überlassen. Begründet durch neue technische Möglichkeiten und einem Konkurrenzkampf der beiden größten Browser-Hersteller Netscape und Microsoft wurde HTML immer wieder um neue Funktionen erweitert. So rückte die Strukturbeschreibung von HTML in den Hintergrund und das Layout einer Seite konnte vom Verfasser jetzt direkt festgelegt werden.

Zwar können Seiten, wie die aus dem vorigem Beispiel, frei formatiert werden. Allerdings geht hier jegliche semantische Information über die Dokumente verloren. Solche HTML-Seiten können nur bedingt durch Programme weiterverarbeitet werden und eine Design-Änderung, wie im einführendem Beispiel würde ein Eingriff in alle Dokumente erfordern. Alle Vorteile, die SGML-basierende Sprachen bieten, sind damit aufgehoben!

XHTML - Die Zukunft des WWW

Durch die Entwicklung von XML wurde die Entwicklung von HTML hin zur Formatierungssprache als Rückschritt erkannt und vom W3C die Extensible Hypertext Markup Language (XHTML) veröffentlicht. Datenstruktur und Layout sind nun wieder getrennt. HTML wurde so durch die neue Sprache XHTML ersetzt.

Dennoch besteht der mit Abstand größte Teil des Netzes aus HTML-Dokumenten. Die von XHTML geforderte Trennung von Inhalt und Darstellung kann nämlich ein Neuerstellen der Dokumente verlangen, wenn die HTML-Dokumente regen Gebrauch von direkten Formatierungselementen machen.

Aufbau
XHTML ist eine XML-Anwendung mit deren Hilfe die Struktur von Webseiten beschrieben werden kann. Es ist eine Weiterentwicklung des auf SGML basierenden HTML.

XHTML, CSS und XML XHTML-Dokumente zeichnen sich durch eine einfache semantische Struktur der Inhalte aus. So werden beispielsweise Überschriften, Absätze und Zitate als solche ausgezeichnet. Mittels CSS (Cascading Style Sheet) können bestimmte Elemente oder Klassen dieser formatiert und positioniert werden. So bleiben Inhalt und Design getrennt, was eine Pflege der Webseiten sehr erleichtert. Darüberhinaus können so leicht Stylesheets für andere Ausgabemedien wie z.B. den Druck erstellt werden ohne das Dokument selbst ändern zu müssen. Die nebenstehende Abbildung  zeigt wie ein XHTML-Dokument durch die Informationen eines Style Sheets angezeigt werden kann. Zu sehen ist auch, daß ein XML-Dokument Grundlage eines XHTML-Dokuments sein kann, indem es mittels XSLT tranformiert wird.

Zusätzlich erlaubt der modulare Aufbau von XHTML eigene oder bereits vorhandene Erweiterungen und Sprachen wie beispielsweise SVG innerhalb von XHTML-Dokumenten zu nutzen.

Beispiel
Ein XTML-Dokumenrt hat die XML-typische Struktur und besitzt einen Verweis auf die verwendete DTD. Hierbei handelt es sich um XHTML 1.0 welches eine zu HTML 4.01 kompatible Version ist. Aktuell ist Version 1.1, welches modularen Aufbau bietet und viele Elemente aus HTML nicht mehr enthält, die oft zu Layoutzwecken verwendet wurden.

Im Kopf-Element wird der Titel definiert. Der eigentliche Text-Körper enthält eine Überschrift erster Ordnung und einen Absatz, welcher Text enthält. Da wir die Darstellung nicht mit Hilfe von Style Sheets festgelegt haben, ist diese hier undefiniert. WebBrowser können jedoch auch solche Dokumente darstellen; sie verwenden intern festgelegte Regeln um beispielsweise Überschriften hervorzuheben. Allerdings darf man hier nicht erwarten, daß die resultierende Ausgabe in allen Browsern identisch ist.

XHTML und die Darstellung im Browser Die Geschichte von XML ist recht jung und hat eine rasante Entwicklung und Verbreitung hinter sich. Wagen wir einen Blick in die Zukunft:
Es ist abzusehen, daß sich XML als Basis für die meisten Datenstrukturen und Dateiformate durchsetzen wird. In Zukunft werden Dokumente zwischen verschiedenen Anwendungen leichter austauschbar sein. Somit steigt auch die Konkurrenz der einzelnen Anwendungen, da man nicht mehr an ein Dateiformat gebunden ist. Durch offene Standards wird es dann möglich sein, Dokumente auch noch dann lesen zu können, wenn die erstellende Anwendung nicht mehr existiert.

Im World Wide Web wird XHTML sich durchsetzen und das veraltete HTML ablösen. Die Inkompatibilität zwischen verschiedenen Browsern wird so bald der Vergangenheit angehören.

Durch die strikte Trennung von Inhalt und Layout wird es zum Beispiel für Behinderte leichter sich im Web zurechtzufinden. Bisher ist es schwierig für Taube oder Blinde eine rein durch das Layout definierte Seite darzustellen. Durch entsprechende CSS-Definitionen können zum Beispiel bestimmte Textteile besonders betont oder mit anderer Stimme vom Rechner vorgelesen werden.

Zusammenfassung

Eine Auszeichnungssprache legt Datenstrukturen und deren Darstellung fest. Mit ihrer Hilfe können Dokumente beschrieben werden, welche aus Daten (den eigentlichen Inhalt) und Meta-Daten, die Informationen zur Struktur der Daten enthalten, bestehen.

Mit Metasprachen wie SGML und der vereinfachten Teilmenge XML können solche Auszeichnungssprachen einheitlich definiert werden. Die eigentliche Sprache wird dann mit einer DTD bzw. XML-Schema beschrieben. Da Inhalt und Darstellung strikt von einander getrennt sind kann eine sinnvolle Darstellung auf ein bestimmtes Ausgabemedium erst anhand von Style-Sheet-Informationen erzielt werden.

Die logische Struktur ermöglicht nicht nur eine inhaltsunabhängige Darstellung sondern ganz besonders auch den Datenaustausch zwischen Programmen oder die Weiterverarbeitung der Dokumente.

Grundlegend hierfür ist die internationale Standardisierung der Sprachen SGML und XML.


Bibliographie - Linksy


Finden Sie diese Webseite gut? Dann empfehlen Sie uns doch einem Freund oder Bekannten.

XML-Kurs:
Übersicht
Auszeichnungssprachen
SGML / XML
Auszeichnungssprachen und das WWW

Links: