Über mich

Dr. O. Hoffmann

Internet und digitale Information

Bekanntlich ist das internet voll von Antworten auf Fragen, die nie jemand gestellt hat - ist es daher nicht ein idealer Ort für jedwede Art von Kurzweil? Eine Spielwiese voll sorglosen Spaßes?
Die Idee des internets ist im Grunde die Verbreitung von Informationen für alle von allen. Ist man erst mal 'drin', liegt einem die virtuelle Welt zu Füßen - nun ja, beinahe jedenfalls. Es gilt Vieles zu beachten. Wer Informationen anbietet, hat sich damit zu beschäftigen, wie dies praktisch umgesetzt wird, damit der zukünftige Leser die Informationen auch lesen kann. Der interessierte Leser muß die Information erst einmal finden - ja und sich dann auch einfach darstellen lassen. Der wesentliche Unterschied zu Medien wie Zeitschriften, Büchern oder auch Litfaßsäulen liegt darin, daß die Information nicht unmittelbar zugänglich ist, sondern immer durch ein Hilfsmittel, den sogenannten browser, beziehungsweise das Darstellungsprogramm interpretiert und zugänglich gemacht werden muß. Dieses zu erreichen, ist sowohl für den Autor als auch den Leser das Hauptthema des internets.

Anders als die Idee kommerzieller Unternehmen, Information zu verschlüsseln, um Geld mit der Ver- und Entschlüsselung von Information verdienen zu können, sollen die Formate im internet frei zugänglich sein - eine phantastische Idee, die es gegen die Verlockungen des Kommerzes zu verteidigen lohnt.
Es geht um nichts geringeres als die Verteidigung des freien, demokratischen, ja sogar freiheitlich anarchistischen Prinzips des internets gegen kapitalistische Interessen.

Daß diese freien Prinzipien gerade mit standardisierten Dateiformaten erreicht werden sollen, ja nur können, mag zunächst erstaunen, relativiert sich aber recht schnell, wenn man etwa ein rezeptives Medium wie das Fernsehen mit dem interaktiven internet vergleicht. Auch das Fernsehprogramm benötigt den Fernseher des Nutzers, um Informationen zu vermitteln. Wenn nun jeder Fernsehsender eine eigene Methode oder Technik wählen würde, um seine Informationen zu verschlüsseln, wäre das Medium für den Nutzer nicht mehr zugänglich. Dieses Prinzip tritt beim internet in verstärktem Maße auf - kann doch jeder Autor und jeder Nutzer sein. Ohne Standard für die Technik ist da kein Informationsaustausch möglich - und das ist ja das eigentliche Ziel des internets und nicht das Dekodieren von Daten zu Informationen. Und Standards für das internet setzen das W3C und einige andere Organisationen und nicht irgendwelche einzelnen Firmen mit privaten Formaten.
Ironischerweise muß man derzeit feststellen, dass auch beim Fernsehen der Trend zur Kommerzialisierung dazu führt, dass Information durch Verschlüsselung gezielt unbrauchbar gemacht wird und versucht wird, durch technisch an sich überflüssige Dekodierungsmaschinen Geld von den Nutzern abzuzocken.

Auch das W3C ist zwar letztlich nur ein Zusammenschluß interessierter Konzerne und kein notwendig kompetentes unabhängiges Gremium von Experten, wie es wünschenswert wäre, aber immerhin einigt man sich in dieser Organisation auf ein gemeinsames Vorgehen mit veröffentlichten und frei zugänglichen Spezifikationen von allgemein und frei nutzbaren Formaten. Leider stellen allerdings auch beim W3C einige finanzkräftige Konzerne immer wieder Eigeninteressen über die eigentlichen Ziele des Zusammenschlusses, etwas Sinnvolles für die Allgemeinheit zu tun.
Zunehmend wird damit auch deutlich, daß nach anfänglich guten Fortschritten die zu Gärtnern gemachten Böcke dabei sind, gute und saubere Konzepte zum eigenen kommerziellen Nutzen absichtlich zu verderben und zu sabotieren.
Das zeigt auch hier den Bedarf, einerseits unabhängige Expertenkommissionen einzusetzen, die sinnvolle Formate spezifizieren, aber auch gleichzeitig mit dem jeweiligen Format eine allgemein und frei verfügbare Referenzimplementierung bereitzustellen, um sicherzustellen, daß die Allgemeinheit Inhalte auch wenigstens mit einem Programm korrekt und komplett präsentiert bekommt.

Statt in die goldene Zukunft eines Informationszeitalters könnten digitale Speichertechnik und Informationsverbreitung über das internet allerdings auch in ein Zeitalter der Finsternis ähnlich dem Mittelalter führen. Dies ist durchaus wahrscheinlich, wenn es nicht gelingt, Standardformate unabhängig von den Interessen kommerzieller Anbieter zu spezifizieren und dazu Referenzimplementierungen frei verfügbar zu machen. Letztlich besteht digitale Information nur aus einer Folge von Bits, welche ohne standardisierte Zusatzinformation darüber, welche Reihenfolge von Bits was zu bedeuten hat, eigentlich gar keine Information ist, sondern nur beliebiges Rauschen. Digitale Formate ohne offen und frei zugängliche Standards und Spezifikationen sind aber nicht mehr als Bitrauschen, sie liefern keinen verläßlichen Zugang zur Information.

Die dauerhafte Archivierung digitaler Daten scheint ein unlösbares Problem zu sein. In erster Linie gilt dies für die verschlüsselten proprietären Datenformate von gewinnorientierten Firmen, die diese innerhalb weniger Jahre aus Gewinnstreben willkürlich ändern und so unzugänglich machen. Teilweise haben sich Unternehmen gar die Möglichkeit geschaffen, digitale Dokumente bei ihren Kunden einfach wieder zu löschen oder technisch unzugänglich zu machen.

Was bei proprietären Formaten nach wenigen Jahren auftritt, ist für Standardformate aber vielleicht nach Jahrzehnten oder Jahrhunderten ähnlich problematisch. Wer schützt die Standards und Spezifikationen vor nachträglichen Manipulationen? Beim Verlust der Information über die Kodierung der Daten (in 0 und 1) sind auch die Informationen selbst verloren.
Bei der Speicherung analoger Information auf Ton, Stein, Papyrus oder Papier waren diese Probleme unbekannt. Einige Werke zumindest haben Jahrtausende und mehrere Kulturen überlebt. Man kann sich heute kaum vorstellen, daß in tausend Jahren noch jemand Disketten, CDs oder DVDs wird lesen können - Archäologen der Zukunft werden mehr aus unseren Müllhalden als aus unseren Bibliotheken über uns lernen können.

Wenn man allerdings bedenkt, daß sicherlich über neunzig Prozent aller internet-Seiten irgendwelchen unsinnigen Unfug anbieten, liegt in der schnellen Vergänglichkeit digitaler Medien auch ein tiefer Trost - wenn vieles von dem Zeug schon nach weniger als einem Jahr dem Vergessen übergeben wird, so ist das nur gut für den Rest der Menschheit. Problematisch ist allerdings der kleine Rest, wobei natürlich aktuell nicht so einfach zu sagen ist, was relevant und erhaltenswert für die Zukunft ist. Daher hat eine Institution wie die Deutsche Nationalbibliothek eigentlich den Auftrag, alles zu sammeln, kann dem aber praktisch wegen der Flüchtigkeit der Information im Netz, wegen proprietärer, verschlüsselter Formate und grob fehlerhafter, unzugänglicher Dokumente gar nicht nachkommen.

Die leichte Verfügbarkeit nahezu jeglicher Information, allerdings mit fragwürdiger Qualität, Zuverlässigkeit und Glaubwürdigkeit im internet stellt auch eine akute Bedrohung einer Gesellschaft dar, die auf qualitativ hochwertiges Wissen und aktuelle Forschung angewiesen ist.
Bei gleichzeitigen Einsparungen im Bereich der Bildung und der Forschung zumindest in Deutschland droht vielleicht schon in ein paar Jahrzehnten eine Zeit ähnlich dem finsteren Mittelalter, wo nur noch die Schriften der Alten wiedergekäut und im eigenen Interesse interpretiert und verwirrt wurden, wo nur noch phantasiert und abgeschrieben wurde, statt Neues aufgrund von Fakten zu erforschen und kompetent zu formulieren. Forschung wird mit Literaturrecherche verwechselt werden.
Wenn für Schüler insbesondere und alle Menschen im Allgemeinen jegliche Information, fragwürdig gewichtet durch geheim gehaltene Algorithmen von Suchmaschinen verfügbar ist, droht die Gefahr, diese Information nicht mehr qualitativ einordnen zu können, nicht mehr selbst sinnvoll über den Wahrheitsgehalt und die Relevanz urteilen zu können. Wenn wir zudem davon ausgehen, daß ein hoher Prozentsatz von Information für Interessierte oder selbst Suchmaschinen durch technische Inkompetenz (einschließlich gezielt eingesetzter Barrieren, die dem finanziellen Gewinn dienen sollen) der Seitenersteller unzugänglich gemacht ist, scheint das Erlangen relevanter aktueller Information im internet zu einem Glücksspiel zu werden.

Semantisches internet

Eine Kernidee des internets ist es auch, Inhalte in Formaten anzubieten, die strukturierte Information über die Inhalte beinhalten. In diesen Auszeichnungssprachen beschreiben die verwendeten Elemente, was der Inhalt zu bedeuten hat, welche Funktionalität damit verknüpft ist. Dies nennt sich das semantische internet. Nach Erfindung der Sprache, der Schrift und des Buchdruckes sind diese Auszeichnungssprachen die nächste große Revolution der Informationsvermittlung. So gibt es inzwischen Sprachen, die nicht nur Text inhaltlich auszeichnen, sondern auch Graphik und Animation und maschinenverstehbare Metainformation über andere Dokumente oder Dokumentfragmente. Genaugenommen ist die Auszeichnungssprache selbst Metainformation über den Inhalt, da die verwendete Semantik die Information darüber liefert, was für eine Rolle der Inhalt spielt.

Wie bei vielen genialen Ideen ist allerdings ein wesentlicher Haken, daß die allermeisten Mitmenschen die Idee nicht verstehen, somit auch nicht begreifen, wie diese Sprachen korrekt zu verwenden sind. Eine falsche semantische Information ist nun schlimmer als gar keine. Viel diesbezüglicher Unfug ist bereits damit zu erklären, daß sie die Erscheinung oder Darstellung von Inhalt mit seiner Bedeutung beziehungsweise Auszeichnung verwechseln. Teils ist das damit zu erklären, daß früher in den auf Papier gedruckten oder geschriebenen Texten derartige Metainformation eben über die äußere Erscheinung gekennzeichnet wurde und es auch immer noch einige elektronische Formate gibt, die in dieser überholten Methodik steckengeblieben sind. Somit ist die geniale Idee erstaunlicher Weise nur schwer vermittelbar. Viele Autoren verharren in einem historischen Ansatz und nutzen nicht die Chancen von Auszeichnungssprachen, Texte qualitativ zu verbessern und gut zu strukturieren. Im Gegenteil, aus dem Verständnisdefizit folgt eine falsche Verwendung der Sprachen und damit eine Korrumpierung auf jeden Fall der eigenen Dokumente, durch die massenhaft falsche Verwendung aber auch die der Formate selbst. Die Zukunft wird zeigen, ob dies nur ein temporäres Problem ist, ein aktuelles Wissensdefizit, oder ob sich hier eine prinzipielle Begrenzheit eines menschlichen Verstandes andeutet, die manche oder viele einfach nicht zu überwinden vermögen.