XML-Ecke

Struktur in den Content!

iBooks Author: E-Book-Publishing so einfach wie nie

iBooks Author

Mit der Mac-Anwendung iBooks Author macht Apple die Gestaltung von E-Books zum Kinderspiel. Das Programm bietet nach dem Start eine Auswahl von sechs Vorlagen an – angefangen bei einem einfachen Layout mit einem Botanik-Beispiel bis zu einer künstlerischen Aufmachung mit einem Beispiel zur Entomologie (Insektenkunde). Hat man sich für eine Vorlage entschieden, kann man gleich damit beginnen, die Seiten für das eigene Buch zu gestalten. Diese werden links in einer Spalte angezeigt – ähnlich wie in einer Präsentationssoftware wie Keynote oder PowerPoint. Ganz oben der Buchtitel: Der Text wird einfach überschrieben, in der Menüleiste findet sich die Formatierung für Schriftart und -größe. Das Vorlagenfoto des Buchtitels wird einfach ersetzt, indem man aus dem Finder ein Foto dorthin zieht: E-Book-Authoring mit Drag and Drop. Das geht auch mit der Apple-Fotosoftware Aperture.

iBooks Author

Die nächste Seite mit der Bezeichnung “Einführungsmedien” kann mit einem Film bestückt werden – das E-Book soll schließlich mehr bieten als ein gedrucktes Buch. Das Inhaltsverzeichnis muss man mit der Hand anpassen – will man etwa eine Gliederung als XML-Datei hier hineinziehen, weist das der iBooks Author zurück. Die nächste Seite bietet an, ein Glossar zu erstellen, für jeden Eintrag wird Mac-typisch auf die Plus-Schaltfläche geklickt.

Die eigentlichen Buchseiten können mit fertigen Textdateien bestückt werden – mit Drag and Drop kann man Texte in den Formaten txt, rtf, html und pdf integrieren. Dokumente im Word- oder Pages-Format werden über das Einfügen-Menü hinzugefügt. Dabei kann man nach der Auswahl der Datei die gewünschte Formatvorlage angeben. Mit XML-Dokumenten kann der Author nichts anfangen. Bei Bildern mag er keine SVG-Grafiken, neben jpg-Dateien werden auch Bilder im Photoshop-Format psd akzeptiert. Über die Menüleiste lassen sich auch Tabellen und Grafiken ins E-Book bringen. Interessant sind die “Widgets”: Hier bieten sich fortgeschrittene Gestaltungsmöglichkeiten mit 3D-Illustrationen oder interaktiven Elementen, umgesetzt als JavaScript- oder HTML5-Code.

Der Author speichert seine Werke in einem eigenen Format mit der Dateiendung .iba. Beim Exportieren werden PDF und ein iBooks-Format angeboten. Ändert man die Dateiendung .ibooks in .epub, so hat man ein Standard-Epub-Dokument, das sich auch mit Nicht-Apple-Software wie der Adobe Digital Editions oder gängigen E-Book-Readern  öffnen lässt. Allerdings fehlt hier noch das Titelbild – dieses erhält man erst, wenn man das E-Book zur Vorbereitung der Veröffentlichung als “iTunes Store package” speichert. Gestartet wird dieser Vorgang mit dem Befehl “Veröffentlichen”. Für die Bereitstellung des E-Books im iBook Store – kostenlos oder zum Verkauf zu den üblichen Apple-Bedingungen – muss man zunächst einen Account als Publisher eröffnen.

Mit iBooks Author wird das kreative Gestalten von E-Book-Anwendungen fürs iPad besonders einfach. Wer auch für andere Plattformen entwickeln oder umfassendere Gestaltungsmöglichkeiten nutzen will, kommt aber wohl nicht umhin, sich mit Anwendungen wie Calibre oder Sigil zu beschäftigen.

Posted in Im Lauf der Zeit | Tagged , | Leave a comment

IPTC treibt Entwicklung von rNews voran

Mit dem neuen Projekt schema.org kommt langsam Bewegung ins semantische Web. Da passt es, dass auch der International Press Telecommunications Council (IPTC) die Entwicklung seines neuen Standards rNews vorantreibt. Auf einem Arbeitstreffen in Berlin billigte die Organisation die Version 0.5 des Standards, der erst im April  vorgestellt wurde. Die “draft version” berücksichtigt die Erfahrungen aus den ersten Tests zur Umsetzung von rNews.

Das Markup von rNews, so erklärte Stuart Myles während der Beratungen in Berlin, bemühe sich um einen ausgewogenen Kompromiss zwischen einer möglichst einfachen Anwendung ohne tiefgreifende Änderungen an bestehenden HTML-Dokumenten und einer einfachen Nutzung ohne komplizierte Software-Werkzeuge zum Parsen, also zur Syntaxanalyse von rNews. Die Änderungen machen das Modell eingängiger und einfacher. So wird nun nicht mehr von “Tags”, sondern von “Concepts” gesprochen – als Basisklasse für Angaben zum Inhalt von Nachrichten . Die zunächst als eigene Klasse festgelegten Angaben zur Überschrift mit der Bezeichnung “Hed” wurden unter den Eigenschaften der Klasse NewsItem subsumiert. Und die bisherige Klasse TickerSymbol wurde nun zu den Eigenschaften von Organization gestellt.

Der IPTC will auch Möglichkeiten für das Mapping, für die Transformation von rNews in andere Formate anbieten, darunter HTML5-Mikrodaten und JSON. Für Verleger soll es damit so einfach wie möglich gemacht werden, rNews in bestehende Workflows einzubinden. “rNews erschließt den Wert der Veröffentlichung von Metadaten bei Online-News, indem es dafür einen einfach zu verwenden Standard bereitstellt, der ausschließlich Web-Technologien verwendet”, erklärte Myles, der die Arbeitsgruppe Semantisches Web beim IPTC leitet und sich bei Associated Press um Nachrichtenformate kümmert. Bis zum nächsten IPTC-Treffen im Oktober soll rNews die Entwurfsphase hinter sich lassen und in der Version 1.0 vorgelegt werden.

Die vom IPTC gepflegten XML-Formate NewsML oder NITF sind vor allem dazu gedacht, Nachrichten-Feeds in die Content-Management-Systeme der Medienunternehmen zu bringen. Diese können den aktuellen Content dann als HTML-Dokumente mit semantischen Metadaten in ihre Web-Angebote bringen. Ob dabei rNews, das schlichtere Mikroformat hNews oder eine künftige Lösung im Rahmen des Suchmaschinen-Projekts schema.org zum bestimmenden Standard werden wird, entscheiden vermutlich nicht zuletzt auch wirtschaftliche Interessen im Spannungsfeld zwischen Medienunternehmen und Suchmaschinen-Betreibern.

Posted in Im Lauf der Zeit | Tagged , , , | Leave a comment

Google und Bing wollen mehr Semantik im Web

Mehrere Suchmaschinen haben ein eigenes Vokabular entwickelt, um mit semantischen Ergänzungen der HTML-Struktur einer Webseite die Qualität der Internet-Suche zu verbessern. Die Initiatoren von schema.org – unter ihnen Google, Bing und Yahoo – fordern die Anbieter von Web-Inhalten auf, diese Ergänzungen in ihre Dokumente einzufügen, “um es den Nutzern einfacher zu machen, relevante Informationen im Web zu finden”. Bei den Festlegungen von schema.org handelt es sich um Mikrodaten: Diese maschinenlesbaren Tags innerhalb des HTML5-Standards verstehen sich als einfachere Alternative zu RDFa, der HTML-Umsetzung des (Resource Description Frameworks), aber auch zu Mikroformaten wie XFN.

Das Vokabular umfasst zunächst eine relativ schlichte Hierarchie von Datentypen und “Dingen” (Things) mit lediglich sieben Kategorien: CreativeWork, Event, Intangible, Organization, Person, Place und Product. Der gesamte Bereich der Natur kommt in diesem Vokabular zunächst nicht vor. Für Erweiterungen des Vokabulars nennt schema.org Empfehlungen und erklärt, dass sinnvolle Erweiterungen in das Kernvokabular von schema.org übernommen werden können.

Die Mikrodaten werden als Attribute zu den Tags div und span angegeben. Ähnlich wie im RDF-Konzept werden sie in Form eines URI (Uniform Resource Identifier) angegeben:

<div itemscope itemtype="http://schema.org/Event"><!-- URI für den Item-Typ "Event" -->
<div itemprop="name">Pressekonferenz</div>
<span itemprop="description">Vorstellung von schema.org</span>
  Termin:
<time itemprop="startDate" datetime="2011-06-07T19:30">  7. Juni 2011, 19.30 Uhr <!-- HTML5-Tag time -->
</div>

Google hat ein Online-Tool bereitgestellt, um die erweiterte Auszeichnung mit schema.org-Attributen zu testen. Das Vokabular hat bislang die Versionsbezeichnung 0.9 – eine erste finale Version soll im Laufe dieses Jahres kommen.

Posted in Im Lauf der Zeit | Tagged , , , , | 1 Comment

LibreOffice will “offenes und einheitliches Format für alle”

Nach den Problemen von OpenOffice.org strebt das Nachfolgeprojekt LibreOffice “ein offenes und einheitliches Format für alle” an. In einem Gespräch auf dem LinuxTag in Berlin sagte Projektmitglied Thomas Krumbein (auf dem Bild 3. von links): “Das ist allerdings ein Traum, den wir seit 20 Jahren haben und der wird auch in den nächsten 20 Jahren nicht realisiert werden. Formate müssten identisch sein, das sind sie aber leider nicht.” Letztlich könnte dies vermutlich nur gesetzlich geregelt werden.

Das Open Document Format (ODF) habe sich bewährt und eine weite Verbreitung gefunden, sagte Krumbein, der auch Gründungsmitglied der Document Foundation ist. Vor allem in Brasilien und Frankreich, aber auch in Deutschland werde es von einem großen Anteil der Anwender eingesetzt. Mit der zunehmenden Verbreitung von LibreOffice werde auch ODF weiter unterstützt. Allerdings verschickten Microsoft-Office-Nutzer ihre Dokumente als docx-Datei, ohne sich Gedanken zu machen, ob das der Empfänger auch lesen könne. Entscheidend sei, ob die Formate ausgetaucht werden könnten.

Der Novell-Manager Holger Dyroff betonte, dass es wichtig sei, die erforderlichen Filter für die jeweils anderen Formate in Microsoft Office und LibreOffice bereitzustellen – hier arbeitet Novell mit Microsoft eng zusammen. Vice President Dyroff sagte: “Da würde ich gerade auch den Microsoft-Office-Nutzer aufrufen, sich mehr mit ODF zu beschäftigen und dann auch die entsprechenden von Microsoft ausgelieferten Import- und Exportfilter zu benutzen, was heute leider relativ selten stattfindet.” Eine gemeinsame Dokument-Format-Lösung auf einer einheitlichen XML-Basis “wäre sicherlich hochgradig angenehm”, aber kaum realistisch. Zurzeit habe Open XML von Microsoft sicherlich den höchsten Marktanteil. In Zukunft sei aber zu erwarten, dass alle offenen Systeme ODF unterstützten, sagte Dyroff. “Da gehört sicherlich LibreOffice dazu, aber auch verschiedene Software-as-a-Service-Anwendungen wie zum Beispiel Google Docs.”

Posted in Im Lauf der Zeit | Tagged , , | Leave a comment