XML-Ecke

Struktur in den Content!

LibreOffice will “offenes und einheitliches Format für alle”

Nach den Problemen von OpenOffice.org strebt das Nachfolgeprojekt LibreOffice “ein offenes und einheitliches Format für alle” an. In einem Gespräch auf dem LinuxTag in Berlin sagte Projektmitglied Thomas Krumbein (auf dem Bild 3. von links): “Das ist allerdings ein Traum, den wir seit 20 Jahren haben und der wird auch in den nächsten 20 Jahren nicht realisiert werden. Formate müssten identisch sein, das sind sie aber leider nicht.” Letztlich könnte dies vermutlich nur gesetzlich geregelt werden.

Das Open Document Format (ODF) habe sich bewährt und eine weite Verbreitung gefunden, sagte Krumbein, der auch Gründungsmitglied der Document Foundation ist. Vor allem in Brasilien und Frankreich, aber auch in Deutschland werde es von einem großen Anteil der Anwender eingesetzt. Mit der zunehmenden Verbreitung von LibreOffice werde auch ODF weiter unterstützt. Allerdings verschickten Microsoft-Office-Nutzer ihre Dokumente als docx-Datei, ohne sich Gedanken zu machen, ob das der Empfänger auch lesen könne. Entscheidend sei, ob die Formate ausgetaucht werden könnten.

Der Novell-Manager Holger Dyroff betonte, dass es wichtig sei, die erforderlichen Filter für die jeweils anderen Formate in Microsoft Office und LibreOffice bereitzustellen – hier arbeitet Novell mit Microsoft eng zusammen. Vice President Dyroff sagte: “Da würde ich gerade auch den Microsoft-Office-Nutzer aufrufen, sich mehr mit ODF zu beschäftigen und dann auch die entsprechenden von Microsoft ausgelieferten Import- und Exportfilter zu benutzen, was heute leider relativ selten stattfindet.” Eine gemeinsame Dokument-Format-Lösung auf einer einheitlichen XML-Basis “wäre sicherlich hochgradig angenehm”, aber kaum realistisch. Zurzeit habe Open XML von Microsoft sicherlich den höchsten Marktanteil. In Zukunft sei aber zu erwarten, dass alle offenen Systeme ODF unterstützten, sagte Dyroff. “Da gehört sicherlich LibreOffice dazu, aber auch verschiedene Software-as-a-Service-Anwendungen wie zum Beispiel Google Docs.”

Posted in Im Lauf der Zeit | Tagged , , | Leave a comment

White Paper vergleicht ODF und OOXML

White Paper: Interoperabilität von DokumentenMicrosoft und das Fraunhofer-Institut für Offene Kommunikationssysteme (FOKUS) haben gemeinsam ein White Paper vorgelegt, das die Unterschiede der Dokumentenformate Office Open XML (OOXML) und Open Document Format (ODF) untersucht.Im Mittelpunkt stehen Anwendungsszenarien für die Umwandlung von OOXML in ODF und umgekehrt.

Dateien beider Formate sind komprimierte ZIP-Pakete aus mehreren einzelnen Dateien, welche den Inhalt und die Formatierung eines Dokuments mit den Mitteln von XML beschreiben. Bei OOXML wird “die Struktur des ZIP-Containers … von der Open Packaging Convention (OPC) definiert, die eine Abstraktionsschicht zwischen der physischen Datei/der Verzeichnisstruktur innerhalb der ZIP Datei und der Dokumentenstruktur ist”. Hingegen enthält ODF keine solche Abstraktionsschicht – “stattdessen werden feststehende Dateinamen für Dokumenteninhalt (content.xml), Stilinformation (styles.xml), Metainformation (meta.xml) und Anwendungseinstellungen (settings.xml) benutzt. Diese Dateien finden sich im Root Directory des Archivs.” Hinzu kommt in der Regel noch eine Thumnail-Ansicht des Dokuments im PNG-Format, wie die Autoren des White Papers, Klaus-Peter Eckert, Jan Henrik Ziesing und Ucheoma Ishionwu erklären.

Bei einem einfachen Musterbrief gibt es keine Probleme, wenn man das eine Format in das andere überträgt: “Einfache Textformatierungen wie Fett- und Kursivschrift, Absatzformatierungen sowie Standard-Textausrichtungen (können) problemlos zwischen verschiedenen Formaten konvertiert werden”. Problematisch wird es erst bei “Theme Fonts” von Microsoft, mit denen ODF nichts anfangen kann.

Im nächsten Anwendungsfall geht es um ein Formular mit Text und Tabellen. Hier kann von einer “Interoperabilität” der beiden Formate kaum noch die Rede sein. Das White Paper stellt fest: “Die Abbildung des Dokuments von einem Standard auf den anderen ist in mehrfacher Hinsicht schwierig.” Vor allem bei der Verarbeitung von Leerräumen (White Spaces) könne es zu größeren Schwierigkeiten kommen. Unterschiedliche Wege gehen beide Formate auch im Umgang mit Korrekturen, was für die gemeinsame Arbeit an Dokumenten von zentraler Bedeutung ist. Weitere Unverträglichkeiten entstehen bei der Verwendung von Vektorgrafiken: Während OOXML dafür ein eigenes DrawingML-Format mitbringt, setzt ODF auf den Standard SVG. Das Ergebnis: “Diese Unterschiede bedingen für Vektorgrafiken Probleme bei der Abbildbarkeit zwischen den beiden Standards.”

Auch bei mathematischen Formeln gibt es Unterschiede. ODF setzt hier allein auf den XML-Standard MathML. OOXML unterstützt dies zwar ebenfalls, verwendet daneben aber die eigene Auszeichnungssprache OMML. Als relativ problemlos stufen die Autoren einfache Tabellen mit grundlegenden Formeln ein. Schwieriger wird es erst bei komplexeren Formeln.

Ebenso ist der Austausch zwischen beiden Formaten unproblematisch, wenn es lediglich um einfache Textfolien in Präsentationen geht. Schwierig wird es aber, wenn aufwendige Folienübergänge und Effekte zum Einsatz kommen: “OOXML unterhält ein weitaus umfangreicheres Line-Up an Funktionen, die sich nur eingeschränkt oder gar nicht nach ODF abbilden lassen.”

Je mehr spezielle Funktionen in Dokumente eingebaut werden, desto problematischer wird die Übersetzung zwischen beiden Formaten: “Zusammenfassend kann festgehalten werden, dass viele Funktionalitäten, speziell bei ‘einfach’ gehaltenen Dokumenten, zwischen den Standards abgebildet werden können, während eine Abbildung anderer Funktionalitäten komplex oder unmöglich sein kann.” Letztlich hängt es also immer vom Einzelfall ab, ob ein Dokument des einen Formats von der auf das andere Format spezialisierten Software auf die gleiche Weise dargestellt wird. Die Studie weist aber auch darauf hin, dass hierbei nicht nur die Formatunterschiede eine Rolle spielen, sondern auch die “Rendering Engine” der Grafik und die verwendete Hardware.

Posted in Im Lauf der Zeit | Tagged , , , | Leave a comment

Rechtsstreit um XML in Microsoft Word

Wegen Verletzung eines Software-Patents für eine XML-Technik aus dem Jahr 1998 hat ein Bezirksgericht in Texas eine einstweilige Verfügung gegen Microsoft erlassen. Das Unternehmen soll binnen 60 Tagen den USA-Vertrieb von Microsoft Word in den Versionen 2003 und 2007 einstellen und dem kanadischen Patentinhaber i4i eine Entschädigung von 200 Millionen Dollar zahlen. Ein Patent auf eine Umsetzung des freien Standards XML? Im O’Reilly-Blog wundert sich der XML-Experte Rick Jeliffe über das noch nicht abgeschlossene Verfahren – Microsoft will in Berufung gehen.

In dem Rechtsstreit geht es um ein Verfahren zur Erstellung von eigenen XML-Dokumenten mit Formularen, was mit Word möglich ist und was sich i4i in einem US-Patent hat sichern lassen. Dabei werden die Tags für ein solches XML-Dokument nicht angezeigt, sondern in einer “metacode map” gesondert gespeichert. Jeliffe meint jedoch: “Frankly, it is difficult to see how a patent on extracting tags and text indexes into a list relates to what Microsoft Word’s customXML does.”

Posted in Im Lauf der Zeit | Tagged , | Leave a comment

Die Grenzen von Office Open XML…

… macht das neue Office 2008 für Mac sichtbar. Dateien, die im neuen Standardformat von Office 2007 unter Windows gespeichert wurden, kann Microsoft Office 2008 auf dem Mac nicht oder nur unvollständig anzeigen.

Im Formatstreit mit dem Open Document Format (ODF) der Open-Source-Gemeinschaft hat Microsoft die Entwicklung von Office Open XML (OOXML) gerade damit begründet, dass alle Bestandteile von Office-Dokumenten in diesem XML-Format abgebildet werden sollen. Eine Ausnahme bilden aber eingebettete Formeln in Word-Dokumenten. Was in Word 2007 für Windows problemlos möglich ist (oben), hinterlässt in Word 2008 auf dem Mac (unten) drei Fragezeichen:

OOXML mit Office 2008 Continue reading

Posted in Im Lauf der Zeit | Tagged , , , , , | Leave a comment