XHTML SVG CSS PHP

Dr. O. Hoffmann

Ausgezeichnet schreiben

Oft ist das Denken schwer,
indes, das Schreiben geht auch ohne es.

Wilhelm Busch

2004-12-12/24, 2005-01-04/08, 2005-02-05, 2005-07-02, 2007-07-01/09, 2007-12-25, 2008-04-06, 2008-11-29

Strukturierte Texte mit einer XML-Auszeichnungssprache wie XHTML erstellen

2. Schreiben mit dem Computer

Schreiben mit dem Computer ist etwas deutlich anderes als etwa mit der Schreibmaschine oder auch mit dem Bleistift, dem Füller oder dem Federkiel. Das Dokument ist digital, Zeichen und Glyphen sind in einer bestimmten Weise kodiert, also einer Abfolge von binären Konstrukten zugeordnet. Das Schreiben selbst kann flexibler gestaltet werden, da digitale Dokumente zu jeder Zeit und an jeder Stelle immer wieder verändert werden können. Die Aufbereitung und Auszeichnung von Text in Form von Elementen mit Attributen und die teilweise interaktive Darstellung von Zusatzinformationen in Attributen oder alternativen Darstellungen ermöglicht auch eine ganz andere Aufbereitung und andere ergonomische Varianten, Information für den jeweiligen Nutzer optimal anzubieten.

2.1 Kodierung des Textes

Ganz zu Beginn hat sich der Autor also erst einmal einem technischen Problem von digitalen Texten zu stellen: Wie soll der Text kodiert werden? Die Problematik unterscheidet sich leicht, je nachdem, ob es um das Dokument auf den lokalen Rechner geht, oder ob es mittels eines web-servers über das internet ausgeliefert werden soll. Bei einem lokalen Dokument, wozu jedes Dokument leicht werden kann, ist die Kodierung geeignet anzugeben. Bei XML dient dazu eine Verarbeitungsanweisung zu Beginn des Dokumentes. Da findet man etwa folgende Verarbeitungsansweisung:

<?xml version="1.0" encoding="iso-8859-1" ?>
oder
<?xml version="1.0" encoding="utf-8" ?>
Das Attribut encoding gibt eine Information über die Kodierung des folgenden XML-Dokumentes, im ersten Falle handelt es sich um iso-8859-1, neben iso-8859-15 eine in Westeuropa und Nordamerika sehr oft verwendete Kodierung, welche etwa auch deutsche Umlaute und die ß-Ligatur umfaßt, in iso-8859-15 ist zudem auch das Eurozeichen enthalten. iso-8859-1 ist schon seit vielen Jahren spezifiziert und ist eine Obermenge zur ASCII-Kodierung, wird daher auch von alten Darstellungsprogrammen verstanden werden. utf-8 ist ein neueres, allgemeineres Konzept mit einem viel größeren Zeichenvorrat und Voreinstellung bei XML, sofern encoding nicht angegeben ist. utf-8 ist besonders wichtig bei internationalen Projekten, wo Informationen in einer breiteren Palette von Sprachen angeboten werden sollen. Bei selteneren Sprachen kann es gar notwendig werden, auf utf-16 auszuweichen (welches mehr Speicherplatz als utf-8 braucht), daher ist es bei größeren internationalen Projekten sinnvoll, bereits ganz zu Beginn die notwendige Kodierung abzuschätzen. Da die Kodierung der Basiszeichen der ASCII-Kodierung in iso-8859-1 und utf-8 die gleiche ist, ist diese Untermenge immer dekodierbar, auch wenn die jeweils andere Kodierung angegeben wurde, nicht aber etwa Umlaute, die anders kodiert sind. Daher kann durch Maskierung von Zeichen unter ausschließlicher Verwendung dieser Untermenge maximale Kompatibilität und Fehlerredundanz gewährleistet werden. In der Praxis reicht heute (Stand 2008) aber auch eine korrekte Angabe der Kodierung aus. Entsprechende Angaben können in einem HTML-Dokument auch innerhalb eines meta-Elementes gemacht werden, wo bei es dann wichtig ist, dieses möglichst direkt hinter der Anfangsmarkierung des head-Elementes zu setzen, um das Dokument möglichst komplett abzudecken. Die Angabe ist zwar so auch in einem XHTML-Dokument durchführbar, oben genannte Verarbeitungsansweisung ist dem aber vorzuziehen und hat bei widersprüchlichen Angaben auch Priorität. Implizit folgt aus dem bisherigen, daß mindestens die Verarbeitungsanweisung nur Zeichen enthalten darf, die auch ohne Angabe der Kodierung dekodierbar sind, im Falle von XML also nur Zeichen aus dem utf-8-Vorrat (der auch begrenzt ist, obige Angaben sind in iso-8859-1 und utf-8 dieselben, insofern gibt es da auch kein Problem). Bei Editoren läßt sich einstellen, in welcher Kodierung Dokumente erstellt werden sollen. Ist das nicht der Fall, sollte der Autor damit keine Dokumente erstellen, die jemals von einer anderen Person oder einem anderen Computer oder auch nur Programm dekodiert werden sollen.

All diese Notationen sehen etwas behelfsmäßig aus, was eine tiefe Ursache darin hat, daß ursprünglich bei der Entwicklung von Betriebssystemen nicht daran gedacht worden ist, an eine eindeutige und einheitliche dateispezifische und dateiinterne Angabe zur Kodierung und vor allem auch zum Format vorzusehen. Solch ein auch vom Autor einfach zu editierender universeller Metadatenblock existiert einfach nicht für elektronische Dateien, weswegen alle aktuellen Bemühungen, um dieses Problem herumzuarbeiten, zwangsläufig Improvisationen sind, von denen einige sogar ziemlich unzulänglich und kontraproduktiv sind, wenn sie im falschen Zusammenhang auftauchen, man denke etwa an die BOM, die in Konflikt mit der Forderung steht, daß bei XML oben beschriebene Verarbeitungsanweisung zu Beginn eines Dokumentes stehen sollte, wenn eine solche angegeben ist, welche dann zudem auch die BOM überflüssig macht.

Kommt das Dokument von einem web-server, so sendet dieser server dem Darstellungsprogramm in einer Metainformation, die dem Nutzer gewöhnlich nicht angezeigt wird, Informationen über die Kodierung des Dokumentes, das eigentliche Format und noch einige weitere Metainformation über das Dokument. Dies hat in diesem Falle einer internet-Verbindung immer Vorrang vor den Angaben im Dokument. Wegen oben genannten Problems des nicht vorhandenen universellen Metadatenblockes in jeder Datei, hat natürlich auch der server Probleme, diese Metainformationen korrekt zusammenzustellen, teilweise werden dem Autor dazu spezielle Hilfen angeboten, sofern nicht vorhanden, rät der server meist, was er senden soll, was nicht unbedingt mit dem übereinstimmen muß, was der Autor im Dokument notiert hat oder wie das Dokument wirklich abgespeichert wurde.
Es ist auch möglich, daß zwischen server und Darstellungsprogramm ausgehandelt wird, welche Kodierung server, Dokument und Darstellungsprogramm gemeinsam verstehen. Dann kann der server theoretisch das Dokument so umkodieren, daß es für das Darstellungsprogramm optimal ist.
Praktisch ergibt sich daraus das Problem, daß in so einem Falle der server auch die Angaben zur Kodierung im Dokument ändern müßte. Im anderen Falle sollte der server eigentlich die Verarbeitungsanweisung im Dokument lesen und die Metainformationen entsprechend anpassen. In der Praxis ist es oft so, daß der server automatisch eine festgelegte Kodierungsangabe sendet und auch das Dokument nicht umkodiert und unverändert läßt. Daher kann es zu Fehlinformationen in der Metainformation kommen, die nicht zum jeweiligen Dokument passen. In solchen Fällen hat der Autor die Wahl, entweder sein Dokument in der voreingestellten Kodierung abzuspeichern oder etwa mittels einer serverseitigen Skriptsprache wie PHP die Metainformation selbst und korrekt senden zu lassen. Alternativ kann bei einigen servern auch eine passende Dateiendung gewählt werden, welche auf die korrekte Kodierung hinweist. Je nach server gibt es auch Möglichkeiten für den Autor, die beim server voreingestellte Kodierung zu überschreiben, auch abhängig von der Dateiendung oder generell für ganze Verzeichnisse samt Inhalt und Unterverzeichnissen.

2.2 Schreibstrategie

Ein weiterer großer Unterschied liegt in der permanenten Änderbarkeit von Dokumentfragmenten in digitalen Formaten. Texte müssen in der endgültigen Form nicht mehr von vorne nach hinten geschrieben werden, der Computer unterstützt durch die digitale elektronische Speicherung nahezu beliebige Schreibstrategien, etwa ein vielschichtiges, fragmentarisches Vorgehen. Leicht können Absätze oder Abschnitte umgestaltet werden, Sätze ergänzt oder Worte verändert werden. Der gesamte Texte muß nicht mehr in der späteren Lesereihenfolge geschrieben werden, sondern in der für den Autor geeigneten Folge. Das kann für den Autor ein großer Vorteil sein, er kann sich aber auch in seinen Fragmenten verlieren, Passagen wiederholen oder vergessen.

Dokumente können viel einfacher von mehreren Autoren geschrieben werden, die erst einmal unabhängig voneinander verschiedene Teilbereiche des Themas bearbeiten können oder alternative Sichtweisen vorbereiten, die erst im Laufe des Gesamtprozesses zu einem Dokument fusioniert werden. Experimentelle Texte können im internet fragmentarisch Kapitel für Kapitel geschrieben oder durch Interaktion mit anderen internet-Nutzern erstellt werden oder auch per elektronischer Post im steten Wechsel. Textsegmente können aus einer Datenbank stammen und für den oder vom jeweiligen Nutzer individuell zusammengestellt werden, was auch inhaltlich zu neuen Aussagen und Sichtweisen führen kann, die ebenso vom Nutzer wie vom Autor abhängen.

Die bitgenaue Kopierbarkeit ohne Informationsverlust ermöglicht ganz neue Ansätze, Texte zu erstellen. Texte im internet müssen eigentlich nie komplett fertig werden, können jederzeit modifiziert werden und die Leser haben über die ganze Zeit Zugriff auf das Dokument. Ob es sich dabei um Vorteile oder Nachteile handelt, hängt natürlich sehr von den Fähigkeiten und der Kreativität der beteiligten Autoren ab. Durch die stete Modifizierbarkeit verliert solch ein Text allerdings auch seine zeitliche Stabilität, seine Verläßlichkeit als zeitunabhängige Informationsquelle. Zumindest im internet bedeutet eine Veröffentlichung unter einem bestimmten URI (universeller Quellenbezeichner) oder einer PURL (permanente Lokalisierung der Quelle) nicht zwangsläufig einen definierten und verläßlichen Schlußpunkt für das Erstellen des Dokumentes. Das kann den Autor sowohl zu mangelnder Sorgfalt verleiten, es ihm aber auch leichter ermöglichen, Fehler zu korrigieren und seinen Lesern so Irrwege zu ersparen.

Was geschrieben steht, steht nicht mehr fest, sondern wird wandelbar wie das gesprochene Wort, vergänglich wie eine Eintagsfliege. Fälschung von Aussagen und Plagiat werden sehr erleichtert. Bei Dokumenten, die zitierbar bleiben oder werden sollen, werden allgemein akzeptierte Instanzen notwendig, die Dokumentversionen zu einem definierten Zeitpunkt archivieren und bestimmten Autoren eindeutig zuordnen.

So oder so ist es nach wie vor sinnvoll, umfangreichere Projekte in einem Konzeptpapier vorzubereiten, sei es wirklich auf Papier oder auch in einer digitalen Datei. Die Strukturen, die Abfolge der Inhalte oder Argumente sollten so festgelegt werden, das Gesamtkonzept sollte festgehalten werden und die komplette Liste der auszuformulierenden Aspekte des Themas. Dieses Konzeptpapier soll helfen, die Gedanken zu sortieren, nicht zu vergessen, alles an einen optimalen Platz im Dokument zu bringen, eine logische Abfolge der Argumente zu realisieren und sich nicht in Fragmenten zu verlieren.
Der Autor sollte sich auch nicht scheuen, einzelne Passagen und gute Formulierungen zu jeglichen Teilen des Themas sofort niederzuschreiben und sie erst später in die Arbeit einzuarbeiten und an das endgültige Umfeld anzupassen. In einer Art Mosaiktechnik kann er so erst einmal alles festhalten, was sonst vergessen werden könnte. Er sollte aber beizeiten alle Mosaikstücke systematisch durchforsten, damit in solch einem Haufen nicht zuletzt Wichtiges untergeht und für den Leser des eigentlichen Werkes verloren ist. Aus so einem Mosaik können dann zusammen mit einer Gliederung mit der Zeit geordnete Argumentationsketten zusammengestellt werden, die recht zwanglos in eine Gliederung eingefügt werden können.

Vor dem Abschluß ist auch nochmals zu kontrollieren und zu verbessern, daß alle Teile des Dokumentes in der Lesereihenfolge gut und logisch zusammenpassen, für den Leser in dieser Reihenfolge verständlich werden, ohne häufig hin und herblättern zu müssen (oder zu rollen, englisch: to scroll).

Nächstes Kapitel
Kapitel: Kurzbeschreibung · 1 · 2 · 3 · 4 · 5 · 6 · 7 · 8 · 9 · 10 · 11