Dr. O. Hoffmann 2004-12-12 - 2004-12-24, 2005-01-04 - 2005-01-08, 2005-02-05, 2005-07-02
Schreiben mit dem Computer ist etwas deutlich anderes als etwa mit der Schreibmaschine oder auch mit dem Bleistift, dem Füller oder dem Federkiel. Das Dokument ist digital, Zeichen und Glyphen sind in einer bestimmten Weise kodiert, also einer Abfolge von binären Konstrukten zugeordnet. Das Schreiben selbst kann flexibler gestaltet werden, da digitale Dokumente zu jeder Zeit und an jeder Stelle immer wieder verändert werden können. Die Aufbereitung und Auszeichnung von Text in Form von Elementen mit Attributen und die teilweise interaktive Darstellung von Zusatzinformationen in Attributen oder alternativen Darstellungen ermöglicht auch eine ganz andere Aufbereitung und andere ergonomische Varianten, Information für den jeweiligen Nutzer optimal anzubieten.
Ganz zu Beginn hat sich der Autor also erst einmal einem technischen Problem von digitalen Texten zu stellen: Wie soll der Text kodiert werden? Die Problematik unterscheidet sich leicht, je nachdem, ob es um das Dokument auf den lokalen Rechner geht, oder ob es mittels eines web-servers über das internet ausgeliefert werden soll. Bei einem lokalen Dokument, wozu jedes Dokument leicht werden kann, ist die Kodierung geeignet anzugeben. Bei XML dient dazu eine Verarbeitungsanweisung zu Beginn des Dokumentes. Da findet man etwa folgende Verarbeitungsansweisung:
<?xml version="1.0" encoding="iso-8859-1" ?>oder
<?xml version="1.0" encoding="utf-8" ?>Das Attribut
encoding
gibt
eine Information über die Kodierung des folgenden XML-Dokumentes,
im ersten Falle handelt es sich um iso-8859-1, neben iso-8859-15 eine in
Westeuropa und Nordamerika sehr oft verwendete Kodierung, welche etwa
auch deutsche Umlaute und die ß-Ligatur umfaßt, in iso-8859-15
ist zudem auch das Eurozeichen enthalten. iso-8859-1 ist schon seit vielen
Jahren spezifiziert und ist eine Obermenge zur ASCII-Kodierung,
wird daher auch von alten Darstellungsprogrammen verstanden werden.
utf-8 ist ein neueres, allgemeineres Konzept mit einem viel größeren
Zeichenvorrat und Voreinstellung bei XML, sofern
encoding
nicht angegeben ist.
utf-8 ist besonders wichtig bei internationalen Projekten, wo Informationen
in einer breiteren Palette von Sprachen angeboten werden sollen. Bei selteneren Sprachen
kann es gar notwendig werden, auf utf-16 auszuweichen (welches mehr
Speicherplatz als utf-8 braucht), daher ist es bei größeren internationalen
Projekten sinnvoll, bereits ganz zu Beginn die notwendige Kodierung abzuschätzen.
Da die Kodierung
der Basiszeichen der ASCII-Kodierung in iso-8859-1 und
utf-8 die gleiche ist, ist diese Untermenge immer dekodierbar, auch wenn
die jeweils andere Kodierung angegeben wurde, nicht aber etwa Umlaute, die
anders kodiert sind. Daher kann durch Maskierung von Zeichen unter
ausschließlicher Verwendung dieser Untermenge maximale
Kompatibilität und Fehlerredundanz gewährleistet werden.
In der Praxis reicht heute (Stand 2008) aber auch eine korrekte Angabe
der Kodierung aus. Entsprechende Angaben können in einem
HTML-Dokument auch innerhalb eines meta
-Elementes
gemacht werden, wo bei es dann wichtig ist, dieses möglichst
direkt hinter der Anfangsmarkierung des head
-Elementes zu setzen, um
das Dokument möglichst komplett abzudecken. Die Angabe ist
zwar so auch in einem XHTML-Dokument durchführbar,
oben genannte Verarbeitungsansweisung ist dem aber vorzuziehen und
hat bei widersprüchlichen Angaben auch Priorität.
Implizit folgt aus dem bisherigen, daß mindestens die
Verarbeitungsanweisung nur Zeichen enthalten darf, die auch ohne
Angabe der Kodierung dekodierbar sind, im Falle von XML
also nur Zeichen aus dem utf-8-Vorrat (der auch begrenzt ist, obige Angaben
sind in iso-8859-1 und utf-8 dieselben, insofern gibt
es da auch kein Problem).
Bei Editoren läßt sich einstellen, in welcher Kodierung Dokumente
erstellt werden sollen. Ist das nicht der Fall, sollte der Autor damit keine
Dokumente erstellen, die jemals von einer anderen Person oder einem
anderen Computer oder auch nur Programm dekodiert werden sollen.
All diese Notationen sehen etwas behelfsmäßig aus, was eine tiefe Ursache darin hat, daß ursprünglich bei der Entwicklung von Betriebssystemen nicht daran gedacht worden ist, an eine eindeutige und einheitliche dateispezifische und dateiinterne Angabe zur Kodierung und vor allem auch zum Format vorzusehen. Solch ein auch vom Autor einfach zu editierender universeller Metadatenblock existiert einfach nicht für elektronische Dateien, weswegen alle aktuellen Bemühungen, um dieses Problem herumzuarbeiten, zwangsläufig Improvisationen sind, von denen einige sogar ziemlich unzulänglich und kontraproduktiv sind, wenn sie im falschen Zusammenhang auftauchen, man denke etwa an die BOM, die in Konflikt mit der Forderung steht, daß bei XML oben beschriebene Verarbeitungsanweisung zu Beginn eines Dokumentes stehen sollte, wenn eine solche angegeben ist, welche dann zudem auch die BOM überflüssig macht.
Kommt das Dokument von einem web-server, so sendet dieser server
dem Darstellungsprogramm in einer Metainformation, die dem Nutzer
gewöhnlich nicht angezeigt wird, Informationen über die
Kodierung des Dokumentes, das eigentliche Format und noch einige
weitere Metainformation über das Dokument. Dies hat in diesem
Falle einer internet-Verbindung immer Vorrang vor den Angaben im Dokument.
Wegen oben genannten Problems des nicht vorhandenen universellen
Metadatenblockes in jeder Datei, hat natürlich auch der server
Probleme, diese Metainformationen korrekt zusammenzustellen,
teilweise werden dem Autor dazu spezielle Hilfen angeboten, sofern
nicht vorhanden, rät der server meist, was er senden soll, was
nicht unbedingt mit dem übereinstimmen muß, was der
Autor im Dokument notiert hat oder wie das Dokument wirklich
abgespeichert wurde.
Es ist auch möglich, daß zwischen server und Darstellungsprogramm
ausgehandelt wird, welche Kodierung server, Dokument und Darstellungsprogramm
gemeinsam verstehen. Dann kann der server theoretisch das Dokument
so umkodieren, daß es für das Darstellungsprogramm optimal ist.
Praktisch ergibt sich daraus das Problem, daß in so einem Falle der
server auch die Angaben zur Kodierung im Dokument ändern
müßte. Im anderen Falle sollte der server eigentlich die
Verarbeitungsanweisung im Dokument lesen und die Metainformationen
entsprechend anpassen. In der Praxis ist es oft so, daß der server
automatisch eine festgelegte Kodierungsangabe sendet und auch das
Dokument nicht umkodiert und unverändert läßt.
Daher kann es zu Fehlinformationen in der Metainformation kommen, die
nicht zum jeweiligen Dokument passen. In solchen Fällen hat der
Autor die Wahl, entweder sein Dokument in der voreingestellten
Kodierung abzuspeichern oder etwa mittels einer serverseitigen
Skriptsprache wie PHP
die Metainformation selbst und korrekt senden zu lassen. Alternativ kann bei einigen
servern auch eine passende Dateiendung gewählt werden, welche auf die
korrekte Kodierung hinweist. Je nach server gibt es auch Möglichkeiten
für den Autor, die beim server voreingestellte Kodierung zu
überschreiben, auch abhängig von der Dateiendung oder generell
für ganze Verzeichnisse samt Inhalt und Unterverzeichnissen.
Ein weiterer großer Unterschied liegt in der permanenten Änderbarkeit von Dokumentfragmenten in digitalen Formaten. Texte müssen in der endgültigen Form nicht mehr von vorne nach hinten geschrieben werden, der Computer unterstützt durch die digitale elektronische Speicherung nahezu beliebige Schreibstrategien, etwa ein vielschichtiges, fragmentarisches Vorgehen. Leicht können Absätze oder Abschnitte umgestaltet werden, Sätze ergänzt oder Worte verändert werden. Der gesamte Texte muß nicht mehr in der späteren Lesereihenfolge geschrieben werden, sondern in der für den Autor geeigneten Folge. Das kann für den Autor ein großer Vorteil sein, er kann sich aber auch in seinen Fragmenten verlieren, Passagen wiederholen oder vergessen.
Dokumente können viel einfacher von mehreren Autoren geschrieben werden, die erst einmal unabhängig voneinander verschiedene Teilbereiche des Themas bearbeiten können oder alternative Sichtweisen vorbereiten, die erst im Laufe des Gesamtprozesses zu einem Dokument fusioniert werden. Experimentelle Texte können im internet fragmentarisch Kapitel für Kapitel geschrieben oder durch Interaktion mit anderen internet-Nutzern erstellt werden oder auch per elektronischer Post im steten Wechsel. Textsegmente können aus einer Datenbank stammen und für den oder vom jeweiligen Nutzer individuell zusammengestellt werden, was auch inhaltlich zu neuen Aussagen und Sichtweisen führen kann, die ebenso vom Nutzer wie vom Autor abhängen.
Die bitgenaue Kopierbarkeit ohne Informationsverlust ermöglicht ganz neue Ansätze, Texte zu erstellen. Texte im internet müssen eigentlich nie komplett fertig werden, können jederzeit modifiziert werden und die Leser haben über die ganze Zeit Zugriff auf das Dokument. Ob es sich dabei um Vorteile oder Nachteile handelt, hängt natürlich sehr von den Fähigkeiten und der Kreativität der beteiligten Autoren ab. Durch die stete Modifizierbarkeit verliert solch ein Text allerdings auch seine zeitliche Stabilität, seine Verläßlichkeit als zeitunabhängige Informationsquelle. Zumindest im internet bedeutet eine Veröffentlichung unter einem bestimmten URI (universeller Quellenbezeichner) oder einer PURL (permanente Lokalisierung der Quelle) nicht zwangsläufig einen definierten und verläßlichen Schlußpunkt für das Erstellen des Dokumentes. Das kann den Autor sowohl zu mangelnder Sorgfalt verleiten, es ihm aber auch leichter ermöglichen, Fehler zu korrigieren und seinen Lesern so Irrwege zu ersparen.
Was geschrieben steht, steht nicht mehr fest, sondern wird wandelbar wie das gesprochene Wort, vergänglich wie eine Eintagsfliege. Fälschung von Aussagen und Plagiat werden sehr erleichtert. Bei Dokumenten, die zitierbar bleiben oder werden sollen, werden allgemein akzeptierte Instanzen notwendig, die Dokumentversionen zu einem definierten Zeitpunkt archivieren und bestimmten Autoren eindeutig zuordnen.
So oder so ist es nach wie vor sinnvoll, umfangreichere Projekte in einem Konzeptpapier
vorzubereiten, sei es wirklich auf Papier oder auch in einer digitalen Datei.
Die Strukturen, die Abfolge der Inhalte oder Argumente sollten so festgelegt werden,
das Gesamtkonzept sollte festgehalten werden und die komplette Liste der
auszuformulierenden Aspekte des Themas. Dieses Konzeptpapier soll helfen,
die Gedanken zu sortieren, nicht zu vergessen, alles an einen optimalen Platz im
Dokument zu bringen, eine logische Abfolge der Argumente zu realisieren und sich
nicht in Fragmenten zu verlieren.
Der Autor sollte sich auch nicht scheuen, einzelne Passagen und gute Formulierungen
zu jeglichen Teilen des Themas sofort niederzuschreiben und sie erst später
in die Arbeit einzuarbeiten und an das endgültige Umfeld anzupassen.
In einer Art Mosaiktechnik kann er so erst einmal alles festhalten, was sonst
vergessen werden könnte. Er sollte aber beizeiten alle Mosaikstücke
systematisch durchforsten, damit in solch einem Haufen nicht zuletzt Wichtiges
untergeht und für den Leser des eigentlichen Werkes verloren ist.
Aus so einem Mosaik können dann zusammen mit einer Gliederung mit der
Zeit geordnete Argumentationsketten zusammengestellt werden, die recht
zwanglos in eine Gliederung eingefügt werden können.
Vor dem Abschluß ist auch nochmals zu kontrollieren und zu verbessern, daß alle Teile des Dokumentes in der Lesereihenfolge gut und logisch zusammenpassen, für den Leser in dieser Reihenfolge verständlich werden, ohne häufig hin und herblättern zu müssen (oder zu rollen, englisch: to scroll).