XHTML in EPUB für Schnelleinsteiger

XHTML in EPUB dient vorrangig dazu, Text semantisch auszuzeichnen. Dazu bietet XHTML eine allerdings nur recht kleine Kollektion von Elementen an, die zudem nicht besonders darauf ausgelegt ist, damit Bücher zu schreiben, weder Belletristik noch Sachbücher.

Die folgende Kurzübersicht mag für den Schnelleinsteiger am nützlichsten in der Quelltextansicht sein, auch im Vergleich zur Präsentation des Dokumentes. Auf eine Präsentation mit einer anderen Stilvorlage oder auf die des Darstellungsprogrammes kann im Stilvorlagenauswahlmenü des Darstellungsprogrammes zugegriffen werden, sofern dieses Programm den Anforderungen von EPUB in der Hinsicht genügt.

Absätze, Überschriften und Bezeichnungen

Dies ist ein Absatz. Ein Absatz ist vermutlich eine der wichtigsten Strukturen in einem Buch des Formates EPUB.
Ein Absatz ist ein abgeschlossener Gedankengang, der oft aus mehreren Sätzen besteht und keine weiteren Strukturierung aufweist. Historisch kann der Absatz als degenerierte Strophe aufgefaßt werden, welcher allerdings keine Unterstruktur wie Zeilen in Strophen von Gedichten mehr aufweist.

Absätze werden mit dem Element p ausgezeichnet. p ist ein Blockelement, welches nur Text, inzeilige Elemente oder Phrasenelemente enthalten darf. Inzeilige Elemente oder Phrasenelemente sind Elemente, die im laufenden Textfluß verwendet werden dürfen, also zum Beispiel innerhalb eines Satzes oder einer anderen Struktur im laufenden Textfluß zum Beispiel eines Absatzes. Text und inzeilige Elemente werden im Folgenden kurz als inzeiliger Inhalt bezeichnet.

Für Überschriften werden die Elemente h1, h2, h3, h4, h5, h6 verwendet.
Das Element h1 ist eine Überschrift ersten Ranges, etwa auf der Titelseite für den Buchtitel. Falls das Dokument nur ein Kapitel repräsentiert, handelt es sich um die Überschrift des Kapitels.
Entsprechend steht h2 für eine Überschrift zweiten Ranges, geeignet also für eine Struktur, die einem h1 untergeordnet ist. Bei einem Dokument für ein Kapitel mit einer h1 für die Kapitelüberschrift dient h2 etwa als eine Überschrift für ein Unterkapitel, h3 für einen Abschnitt im Unterkapitel etc. Man sollte in der Reihenfolge der Ränge keinen Rang auslassen, also ein Dokument nicht mit h2 oder h3 beginnen oder auf ein h1 ein h3 folgen lassen, das h2 auslassend.
Der Inhalt dieser Elemente für Überschriften ist wie für p inzeiliger Inhalt.

Betonen

Betonen kann man mit dem Element em. Stark betonen kann man mit dem Element strong.

em und strong sind Beispiele für inzeilige Elemente oder Phrasenelemente, die nur in Blockelementen auftreten dürfen.

Zitieren

Zitieren innerhalb eines Absatzes, im laufenden Textfluß kann man mit dem inzeiligen Element q: Alles ist in Bewegung und nichts bleibt stehen [Heraklit von Ephesus].
Mit dem Attribut cite kann dabei eine Quelle für das Zitat referenziert werden. Eine Präsentation der Referenzierung oder ein Hinweis darauf ist allerdings in EPUB für Darstellungsprogramme nicht erforderlich.
Hier wird auch nur auf ein inzeiliges Element cite verwiesen, in welchem steht, wer zitiert wird. Da dies direkt hinter dem Zitat steht, ist der Bezug im Text auch ohne das Attribut cite klar.

Empfehlenswert ist also nicht nur für EPUB, mit dem Attribut cite immer nur auf ein Element cite im normalen Textfluß zu verweisen, wo die Quelle angegeben ist oder referenziert wird.
Da der Leser eines Buches nicht unbedingt einen Netzzugang haben muß, wird es zumeist sinnvoll auch sein, dann lediglich auf einen Eintrag im Literaturverzeichnis zu verweisen, wo die Quelle ausführlich angegeben ist, statt sie direkt im Text zu referenzieren.

Vom sonstigen Text abgesetzte Zitate mit Blockelementen wie ganzen Absätzen darin werden mit dem Element blockquote realisiert, welches dann außerhalb eines Absatzes als eigenständige Struktur (Blockelement) notiert wird:

Eins, zwei, drei im Sauseschritt
eilt die Zeit - wir eilen mit.
[Wilhelm Busch]

Für Autoren der schönen Literatur, der Belletristik:
Zitate sind zu unterscheiden von wörtlicher Rede von Charakteren im Buch. Zitiert wird in der Regel aus realen anderen Werken oder es werden reale Personen zitiert. Wörtliche Rede von Charakteren im Buch wird hingegen einfach in Anführungsstriche gesetzt oder kursiv oder auch gar nicht besonders gekennzeichnet, je nach Stil des Autors. Elemente zum Zitieren sind dafür jedenfalls ungeeignet.
Unbenommen bleibt es dem Autor etwa eines Romans, die Elemente für fiktive Zitate einzusetzen, um den Eindruck zu erwecken, im Verlauf der Handlung werde jemand zitiert.

Und noch ein Hinweis zu Zitaten: Nicht korrekt gekennzeichnete oder geeignet ausgezeichnete Zitate sind in der Regel Urheberrechtsverletzungen und können daher rechtliche Konsequenzen in vielfältiger Hinsicht haben.

Listen

Listen sind ebenfalls eigenständige Blockelemente. Es gibt Listen, bei denen die Reihenfolge der Listenpunkte wichtig ist, umgesetzt mit dem Element ol, und welche, bei denen die Reihenfolge der Listenpunkte nicht wichtig ist, umgesetzt mit dem Element ul. Die Listenpunkte in beiden werden mit Elementen li ausgezeichnet, welche entweder nur inzeiligen Inhalt oder nur Blockelemente enthalten sollten.

Als Beispiel die Platzierung beim Wettbewerb Spargelstechen:

  1. Gunilla
  2. Siggi
  3. Raaner
  4. Wilma
  5. Ougust

Als Beispiel die Zutaten einer Spargelsuppe für fünf Personen:

Definitionslisten funktionieren etwas anders. Sie stehen in einem Blockelement dl, darin stehen Elemente dt für den zu definierenden Ausdruck, repräsentiert durch Text oder inzeilige Elemente. Der definierende Text steht in Elementen dd. Deren Inhalt sollten nur entweder Blockelemente oder inzeiliger Inhalt sein.
Eine bestimmte Reihenfolge der Elemente in dl ist nicht festgelegt, es können also insbesondere auch mehrere Ausdrücke definiert werden oder mehrere Definitionen für Ausdrücke notiert werden.
Plausibel ist es, die Listenpunkte mit den zu definierenden Ausdrücken jeweils vor die Listenpunkte zu stellen, die die zutreffenden Definitionen enthalten.

Als Beispiel einige oft in EPUB verwendete XHTML-Elemente:

html
Wurzelelement mit Namensraumangabe, Inhalt: erst ein head, dann ein body
head
Element für Metainformationen über das Element, muß mindestens ein title enthalten.
title
Dokumenttitel, enthält einfachen Text
body
Behälter für den eigentlichen Dokumentinhalt, als Inhalt nur Blockelemente
p
Absatz, Blockelement, nur inzeiliger Inhalt
h1
Primäre Überschrift, Blockelement, nur inzeiliger Inhalt
h2
Sekundäre Überschrift, Blockelement, nur inzeiliger Inhalt
h3
Überschrift dritten Ranges, Blockelement, nur inzeiliger Inhalt
h4
Überschrift vierten Ranges, Blockelement, nur inzeiliger Inhalt
h5
Überschrift fünften Ranges, Blockelement, nur inzeiliger Inhalt
h6
Überschrift sechsten Ranges, Blockelement, nur inzeiliger Inhalt
address
Kontaktadresse des Autors, Blockelement, nur inzeiliger Inhalt
blockquote
Zitat, Blockelement, als Inhalt nur Blockelemente
div
Blockelement ohne inhaltliche Bedeutung, inzeiliger Inhalt oder Blockelemente
a
Verweis, inzeiliges Element, nur inzeiliger Inhalt, a darf kein Nachfahre von a sein
abbr
Abkürzung, inzeiliges Element, nur inzeiliger Inhalt
br
Zeilenumbruch, inzeiliges Element, kein Inhalt
em
Betonter Text, inzeiliges Element, inzeiliger Inhalt
q
Zitat, inzeiliges Element, inzeiliger Inhalt
cite
Quelle eines Zitates, bevorzugt ein Werk; wenn nicht verfügbar, auch der Name der zitierten Person; inzeiliges Element, inzeiliger Inhalt
strong
Stark betonter Text, inzeiliges Element, inzeiliger Inhalt
object
Eingebettetes Objekt wie ein Bild, inzeiliges Element, inzeiliger Inhalt oder Blockelemente
img
Bild inzeiliges Element, kein Inhalt
dfn
Definition, inzeiliger Inhalt
sub
Tiefgestellter Text, inzeiliger Inhalt
sup
Hochgestellter Text, inzeiliger Inhalt
span
Inzeiliges Element ohne inhaltliche Bedeutung, inzeiliger Inhalt
i
Kursiver Text ohne spezielle semantische Bedeutung, inzeiliger Inhalt
b
Fetter Text ohne spezielle semantische Bedeutung, inzeiliger Inhalt
ul
Liste, Reihenfolge der Listenpunkte nicht wichtig, Blockelement, Inhalt: li-Elemente
ol
Liste, Reihenfolge der Listenpunkte wichtig, Blockelement, Inhalt: li-Elemente
li
Listenpunkt, Inhalt: inzeiliger Inhalt oder Blockelemente
dl
Definitionsliste, Blockelement, Inhalt: Elemente dt, dd
dt
Definitionsterm, zu definierender Begriff, inzeiliger Inhalt
dd
Definitionstext, definierender Text, inzeiliger Inhalt oder Blockelemente
del
Gestrichene Textpassage, kann inzeiligen Inhalt oder Blockelemente enthalten; per Definition ein inzeiliges Element, kann aber bei Blockelementen als Inhalt auch dort stehen, wo diese Blockelemente stehen können, bei inzeiligem Inhalt dort, wo inzeiliger Inhalt stehen kann.
ins
Eingefügte Textpassage, kann inzeiligen Inhalt oder Blockelemente enthalten; per Definition ein inzeiliges Element, kann aber bei Blockelementen als Inhalt auch dort stehen, wo diese Blockelemente stehen können, bei inzeiligem Inhalt dort, wo inzeiliger Inhalt stehen kann.

Tabellen und weitere Strukturen

Tabellen und einige andere Strukturen gibt es natürlich auch. Das alles und viel mehr Details werden aber hier nicht erläutert, dafür sein ein Buch über XHTML empfohlen: wikibook zu XHTML.

Zum Seitenanfang
Zum ersten Kapitel