Schlagwort-Archive: content.opf

Antwort auf die Google-Suche: „wie findet man isbn von ebooks heraus“?

Jemand gelangte mit der Google-Suchanfrage: „wie findet man isbn von ebooks heraus“ auf dieses Blog. Das kann ich ihm oder ihr beantworten: In der Regel findet man die ISBN im Impressum eines Buches ausgeschrieben. Sollte dies bei deinem E-Book widererwartend nicht der Fall sein, nicht verzagen, denn in jedem ePub gibt es eine Datei mit dem Namen content.opf. In dieser content.opf werden unter anderem die Metadaten definiert. und eine notwendige Angabe ist der Book-Identifier. Das sieht dann ungefähr so aus:

<dc:identifier id="BookId" opf:scheme="ISBN">1234xyz</dc:identifier>

Die Frage, die sich jetzt nur noch stellt, lautet: wie kann ich die Book-ID auslesen. Die einfachste Lösung ist: Datei.epub kopieren, Kopie umbenennen in Datei.zip, entpacken, die Datei content.opf suchen, mit einem Texteditor öffnen, die Info auslesen.

Wem das zu umständlich ist, der kann mit manchem Reader auf die Info zurückgreifen. Leider sind die E-Reader sehr wählerisch, welche Metadaten sie anzeigen. (Ernsthaft: wer programmiert die Dinger? Und warum kommt er/sie nicht auf die Idee, dass ein E-Reader ALLE Metadaten auslesen können soll?)
Bei BookReaderLite und ADE habe ich überhaupt keine Anzeige der Metadaten gefunden. Calibre zeigt zwar jede Menge Kladeradatsch an, den man auch editieren kann, man kann sogar nach ISBNs suchen, aber mir ist es nicht gelungen, mir die ISBN anzeigen zu lassen. Statt dessen kam ich mit Stanza zum Erfolg. Stanza ist sonst zwar eher… Na, ja. Aber hier bietet es eine einfache Lösung. Beim MAc unter Ansicht->Book Info findet man ein Feld, in dem die ISBN steht.

Ach ja, bei Mobi gibt es keine ISBNs sondern nur die ASIN (Amazon Standard Identification Number) und bei PDF könnt ihr die Metadaten – wenn sie angegeben sind und das ist eher selten der Fall – mit Hilfe von Acrobat (ganz sicher mir Pro, beim Reader bin ich mir nicht sicher) auslesen.

Advertisements

2 Kommentare

Eingeordnet unter #ePrdctn, Hintergründe, Lesegeräte

#Eprdctn 1 – Die ePUB-Datei

Ich habe hier jetzt schon so oft erzählt, dass ich es voll drauf habe mit der #Eprdctn *hüstel*, da dachte ich mir, ich sollte das auch langsam mal unter Beweis stellen. Ich möchte dies tun, indem ich euch einfach mal unser Objekt der Begierde vorstellen möchte: Das E-Book.
Wie ein guter Anatom (oder sagt man Anatomist?) möchte ich das von innen heraus tun. Im Zentrum davon wird das Dateiformat ePUB stehen, wobei es für heute erst einmal egal ist, ob in der Version 2 oder 3.

Warum ePUB? Ganz einfach!

Meiner bescheidenen Meinung nach ist PDF gar kein E-Book-Format, sondern eine exhumierte Datei, mit der man ein Layout zur Druckerei trägt. Klar es gibt wunderschöne PDFs, auch die neuen interaktiven Elemente sind (teilweise) durchdacht und machen Spaß, aber um PDF geht es mir hier schlichtweg nicht. Wollt ihr ein PDF erzeugen, dann besorgt euch am besten InDesign, das ist und bleibt das beste Layoutprogramm für diesen Zweck. Wenn ihr gerade keine 900€ im Sparschwein habt, dann könnt ihr mit ‚Word‘ oder dem ‚OpenOffice Writer‘ auch schon ein bisschen was anfangen und aus letzterem sogar direkt PDFs exportieren.

Unser dritter Kandidat, das Mobipocket-Format, also die Kindle-nativen Dateien wiederum sind kein offenes Format. Es gibt zwar vertrackte Methoden, eine Mobipocket-Datei zu öffnen (leider finde ich gerade den Link nicht, ich werde ihn nachreichen), aber eigentlich will Amazon das nicht und es ist auch nicht notwendig, denn im Grunde steckt dahinter das gleiche wie bei ePUB und Amazon empfiehlt sogar explizit, dass man sein E-Book in ePUB schreibt und dieses dann anschließend mit dem KindleGen in mobi umwandelt. Natürlich muss man darauf achten, welche Spezifikationen kf8 (das ist die neueste Sprache, die hinter mobi steckt) unterstützt und welche nicht. Ich habe rechts die Dokumentation verlinkt.

ePUB

Womit ich also bislang gearbeitet habe und weiter arbeiten werde, ist ePUB. Die erste Frage, die sich uns stellt, ist: wie erzeuge ich denn so eine ePUB-Datei. Ein ePUB ist im Grunde nichts weiter als ein Zip-Ordner. Ihr könnt sogar euer E-Book umbenennen von DieUndertaker24.COM/YEAH!.epub in .zip und es anschließend entpacken. Aber vorsichtig! Macht das nicht mit der einzigen Version, die ihr habt, denn wenn ihr es anschließend wieder zippt und umbenennt, ist es unleserlich. Ihr müsst es ganz speziell zippen, für Mac habe ich unter ‚Tools‘ ja bereits ein Programm hierfür vorgestellt, für andere Betriebssysteme suche ich noch.

Im Grunde könntet ihr also alle Dateien stur mit einem Texteditor schreiben, dann verpacken und hättet so euer ePUB. Natürlich gibt es komfortablere Methoden. Beispielsweise könnt ihr euer E-Book erst in einem anderen Programm layouten, angefangen vom einfachen Texteditor über Word bis hin wieder zu InDesign und das so entstandene Dokument dann mit diversen Tools in ePUBs umwandeln. Da gibt es Tools, die bessere Ergebnisse liefern (einmal mehr: InDesign) und welche die schlechtere liefern (etwa Calibre). Schließlich bleibt euch noch der Weg, mit einem speziellen ePUB-Editor zu arbeiten (einzig mir bekannter: Sigil) und da ich gerade eben nicht die 900 Euronen für InDesign habe, Calibre mir zu unsauber arbeitet und wir so oder so den Code noch einmal Zeile für Zeile anschauen müssen, wenn wir gute Ergebnisse wollen, wird Sigil das Instrument meiner Wahl sein.

Die Ordnerstruktur eines ePUB

Doch noch nicht heute, wo es mir erst einmal ums Kennenlernen geht. Denn Sigil versteckt vor uns pflichtbewusst all die Dateien, die wir nicht brauchen, sondern die Sigil automatisch erzeugen kann. Daher habe ich ein ePUB, an dem ich gerade bastle, entpackt und stelle es euch hier vor. Leser, das ist ePUB. ePUB, das ist der Leser.

ePUB-Datei

Wie ihr sehen könnt, stecken in unser Datei zwei Ordner und eine mimetype-Datei. Die mimetype definiert für jede Maschine, die versucht, unser ePUB zu lesen, um welchen Dateityp es sich handelt. Die Wikipedia erklärt das ganz wunderbar, sodass ich hier gar nicht weiter darauf eingehen muss.

Ordner Meta-Inf in der ePUB-Datei

Der Ordner META-INF ist ebenfalls schnell abgehandelt, er enthält lediglich eine XML-Datei, die nichts weiter tut, als dem Lesegerät zu sagen, dass es eigentlich alle Infos, die es braucht im Ordner OEBPS in der Datei content.opf findet.

Wirklich spannend ist also der Ordner OEBPS. Das steht für ‚Open eBook Publication Structure‘ und ist ein Relikt aus den Anfängen der digitalen Bücher, denn der Vorläufer unseres ePUB-Standards nannte sich noch ‚Open eBook‚. Schön, dass wir uns so noch ein bisschen an ihn erinnern.

Ordner OEBPS einer ePUB-Datei

Dieser OEBPS-Ordner wurde von Sigil erzeugt. Der Inhalt muss nicht bei jedem ePUB genauso aussehen, aber die hier vorhandenen Elemente müssen immer da sein. Gehen wir sie der Reihe nach durch.

content.opf

Das Herzstück ist die Datei content.opf. Es handelt sich hierbei um die Container-Datei, die hauptsächlich mit dem Reader kommuniziert, indem sie ihm sagt, wo er welches Dateiformat findet, in welcher Reihenfolge er die Textdateien anzeigen soll und welche Metainformationen der Editor mitgeliefert hat. Wir werden uns noch ausführlich mit der content.opf befassen, denn ohne sie gibt es kein E-Book. Hier ist nur erst einmal wichtig, dass alle Ordner und Dateien in der content.opf ausgezeichnet sein müssen, oder sie existieren für die Lesegeräte schlichtweg nicht. Solange ihr das aber macht, könnt ihr die wildesten Ordnerstrukturen anlegen oder komplett auf Ordner verzichten.

Fonts

Als nächstes haben wir da den Ordner ‚Fonts‘, in den ihr einfach alle Schriftsätze packt, die ihr in eurem E-Book verwenden wollt, am besten im ‚Open Type‘-Format. Aber Obacht! Schaut euch die Lizenzen der Fonts genau an. Dürft ihr sie verwenden? Dürft ihr sie auch kommerziell verwenden? Und last not least: dürft ihr sie denn auch weitergeben? Wie ich oben beschrieben habe, kann jeder, der ein ePUB erwirbt (das nicht mit DRM versehen ist) dieses einfach entpacken und sich die Schriftsätze herausholen. Meines Wissens nach gibt es noch keinen Präzedenzfall, ob der Verlag dann für die Weitergabe haftet.

Images

Der Ordner ‚Images‘ enthält entsprechend alle Bilder, die im ePUB verwendet werden sollen.

Styles

Der Ordner ‚Styles‘ enthält die CSS-Datei, die später der Hauptverantwortliche sein wird für das Aussehen eures E-Books. Wenn ihr wollt, könnt ihr auch mehrere CSS-Dateien verwenden, ihr müsst sie nur entsprechend angeben. Ferner müsst ihr beachten dass ePUB (genau wie mobi) nicht alle CSS-Befehle akzeptiert, die im Web funktionieren. Außerdem gibt es eine Handvoll Befehle, die im Netz keinen Sinn machen würden und ePUB-spezifisch sind. Das alles findet ihr in den von mir verlinkten Dokumentationen und ich werde später auch noch genauer darauf eingehen.

Text

Als nächstes haben wir da noch den Ordner ‚Text‘ in diesem steckt – ihr habt es bestimmt erraten – unser eigentlicher Buchtext. Und zwar in Form von HTML-Dokument(en). Prinzipiell könnt ihr alles in ein HTML-Dokument packen. Allerdings sind besonders die reinen E-Reader in Sachen Rechenleistung etwas schwach auf der Brust, sodass ich euch das nicht raten kann. Genauso könntet ihr für jeden Satz ein eigenes HTML-Dokument anlegen, aber auch das ist nicht ratsam, denn bei jeder neuen Datei fügen die Reader automatisch und notgedrungen einen Seitenumbruch ein. Ihr solltet euch also vor Beginn eine sinnvolle Dokumentstruktur überlegen. Als Faustregel sind Kapitel ein guter Beginn.

Das Inhaltsverzeichnis

Schließlich haben wir noch die Datei mit dem kryptischen Namen toc.ncx. Das ist das Inhaltsverzeichnis (Table of Content). So ziemlich jeder Reader kann Seitenunabhängig immer auf das Inhaltsverzeichnis zugreifen. Damit dies gelingt, braucht er die toc.ncx.

So lieber Leser, das ist also unser ePUB. Ich hoffe, es ist dir sympathisch und du schaust mal wieder rein. Bis dahin: viel Spaß!

2 Kommentare

Eingeordnet unter #ePrdctn