#ePrdctn 3 – Der Dokumenttyp

ePub arbeitet mit HTML-Dateien. Euren eigentlichen Buchtext schreibt ihr in diese Datei, zeichnet ihn mit den entspechenden Befehlen aus und könnt ihm anschließend mit Hilfe von CSS die Haare schön machen.

Deklaration des Dokumenttyps

Der erste Schritt, um ein HTML-Dokument für euer Buch zu erstellen, ist, dieses als ein HTML-Dokument auszuzeichnen.

Dafür dient die kryptische Zeichenfolge am Anfang des Dokuments. Diese wird praktischerweise von Sigil automatisch erstellt, aber da Aufklärung der Weg aus der selbstverschuldeten Unmündigkeit ist, schauen wir uns einfach mal an, was da steht.

Die erste Zeile sieht wie folgt aus:

Auszeichnung als XML Dokument

Die Zeile wird eingeklammert mit

Dokumentdefinitionsklammer

was der Maschine, die das Dokument liest, sagt, dass es hier die Dokumentdefinition findet. Als nächstes steht da

xml version=“1.0“

Das bedeutet, dass dieses Dokument eines vom Typ XML ist und sich an die Version 1.0 hält. Das dürfte jetzt etwas verwirren, da ich ja eben noch gesagt habe, wir haben es mit einem html-Dokument zu tun. Nun XML ist zunächst einmal die Metasprache. Das sagt der Maschine, wie unsere Auszeichnungen aufgebaut sind, besipielsweise:

Beispiel einer Auszeichnung

Während HTML oder genauer XHTML dann ein Subset der Metasprache ist, das definiert, was denn in diesem XML-Dokument gültige Auszeichnungen sind. Etwa zeichnet

Absatzauszeichnung

einen Absatz aus.

Doch zurück zu unserer ersten Zeile. Als nächstes steht da

encoding="utf-8"

Das definiert den Zeichensatz, in dem ihr euren Text geschrieben habt. Ich hatte die Hintergründe dazu erst kürzlich verlinkt. Die Maschine schaut einfach in einer Tabelle nach, welch komisches Zeichen ihr da verwendet und gibt es dann entsprechend aus.
Ihr müsst nicht unbedingt utf-8 benutzen, Spiegel Online verwendet beispielsweise „iso-8859-1“. Allerdings ist utf-8 weitverbreitet und leistet gute Arbeit. Ihr könntet sogar ein E-Book in Klingonisch schreiben, und utf-8 wäre in der Lage dieses darzustellen. Daher würde ich einen Wechsel nur empfehlen, wenn ihr dafür triftige Gründe habt.

Die letzte Auszeichnung in der ersten Zeile lautet

standalone="no"

Das sagt der Maschine, dass die Definition (Document Type Definition (DTD)) für die XML-Sprache, die ihr verwendet (in unserem Fall also XHTML), nicht in dieser Datei mitgeliefert ist. Stattdessen wird der Ort einer Referenzdatei, auf die ihr euch bezieht, in der nächsten Zeile zusammen mit der Definition als XHTML-Datei geliefert.

Auszeichnung als XHTML-Datei

In dieser Zeile steht also endlich, dass es sich um ein Dokument vom Typ html handelt, dass es auf der Version XHTML 1.1 des W3C basiert, dass es auf Englisch (damit sind die Auszeichnungen gemeint, nicht euer eigentlicher Text) verfasst ist und wo die Referentdatei zu finden ist.

Damit ist die Definition des Dokumententyps abgeschlossen und ihr beginnt mit der eigentlichen html-Auszeichnung, die eingerahmt wird von den Tags

HTML-Tag

In unserem Fall steht da:

XHTML-Tag

Da wir in unserer ePub-Datei XHTML verwenden, wird das hier noch einmal spezifiziert und der Maschine gesagt, wo es wieder den Katalog mit den gültigen Auszeichnungen findet, in dem dann steht, dass etwa

p-Tag, h1-Tag, div-Tag

etc. gültige Auszeichnungen sind.

Das ist unsere Dokumentenauszeichnung. Als nächstes könnt ihr noch ein paar Angaben im Kopfbereich
head-Tag

der HTML-Datei machen und zu guter letzt euren Inhalt in den

body-Tag

hineinmeißeln.

Viel Spaß!

Advertisements

Hinterlasse einen Kommentar

Eingeordnet unter #ePrdctn

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s