xml

XML-Ecke

Struktur in den Content!

White Paper vergleicht ODF und OOXML

White Paper: Interoperabilität von DokumentenMicrosoft und das Fraunhofer-Institut für Offene Kommunikationssysteme (FOKUS) haben gemeinsam ein White Paper vorgelegt, das die Unterschiede der Dokumentenformate Office Open XML (OOXML) und Open Document Format (ODF) untersucht.Im Mittelpunkt stehen Anwendungsszenarien für die Umwandlung von OOXML in ODF und umgekehrt.

Dateien beider Formate sind komprimierte ZIP-Pakete aus mehreren einzelnen Dateien, welche den Inhalt und die Formatierung eines Dokuments mit den Mitteln von XML beschreiben. Bei OOXML wird “die Struktur des ZIP-Containers … von der Open Packaging Convention (OPC) definiert, die eine Abstraktionsschicht zwischen der physischen Datei/der Verzeichnisstruktur innerhalb der ZIP Datei und der Dokumentenstruktur ist”. Hingegen enthält ODF keine solche Abstraktionsschicht – “stattdessen werden feststehende Dateinamen für Dokumenteninhalt (content.xml), Stilinformation (styles.xml), Metainformation (meta.xml) und Anwendungseinstellungen (settings.xml) benutzt. Diese Dateien finden sich im Root Directory des Archivs.” Hinzu kommt in der Regel noch eine Thumnail-Ansicht des Dokuments im PNG-Format, wie die Autoren des White Papers, Klaus-Peter Eckert, Jan Henrik Ziesing und Ucheoma Ishionwu erklären.

Bei einem einfachen Musterbrief gibt es keine Probleme, wenn man das eine Format in das andere überträgt: “Einfache Textformatierungen wie Fett- und Kursivschrift, Absatzformatierungen sowie Standard-Textausrichtungen (können) problemlos zwischen verschiedenen Formaten konvertiert werden”. Problematisch wird es erst bei “Theme Fonts” von Microsoft, mit denen ODF nichts anfangen kann.

Im nächsten Anwendungsfall geht es um ein Formular mit Text und Tabellen. Hier kann von einer “Interoperabilität” der beiden Formate kaum noch die Rede sein. Das White Paper stellt fest: “Die Abbildung des Dokuments von einem Standard auf den anderen ist in mehrfacher Hinsicht schwierig.” Vor allem bei der Verarbeitung von Leerräumen (White Spaces) könne es zu größeren Schwierigkeiten kommen. Unterschiedliche Wege gehen beide Formate auch im Umgang mit Korrekturen, was für die gemeinsame Arbeit an Dokumenten von zentraler Bedeutung ist. Weitere Unverträglichkeiten entstehen bei der Verwendung von Vektorgrafiken: Während OOXML dafür ein eigenes DrawingML-Format mitbringt, setzt ODF auf den Standard SVG. Das Ergebnis: “Diese Unterschiede bedingen für Vektorgrafiken Probleme bei der Abbildbarkeit zwischen den beiden Standards.”

Auch bei mathematischen Formeln gibt es Unterschiede. ODF setzt hier allein auf den XML-Standard MathML. OOXML unterstützt dies zwar ebenfalls, verwendet daneben aber die eigene Auszeichnungssprache OMML. Als relativ problemlos stufen die Autoren einfache Tabellen mit grundlegenden Formeln ein. Schwieriger wird es erst bei komplexeren Formeln.

Ebenso ist der Austausch zwischen beiden Formaten unproblematisch, wenn es lediglich um einfache Textfolien in Präsentationen geht. Schwierig wird es aber, wenn aufwendige Folienübergänge und Effekte zum Einsatz kommen: “OOXML unterhält ein weitaus umfangreicheres Line-Up an Funktionen, die sich nur eingeschränkt oder gar nicht nach ODF abbilden lassen.”

Je mehr spezielle Funktionen in Dokumente eingebaut werden, desto problematischer wird die Übersetzung zwischen beiden Formaten: “Zusammenfassend kann festgehalten werden, dass viele Funktionalitäten, speziell bei ‘einfach’ gehaltenen Dokumenten, zwischen den Standards abgebildet werden können, während eine Abbildung anderer Funktionalitäten komplex oder unmöglich sein kann.” Letztlich hängt es also immer vom Einzelfall ab, ob ein Dokument des einen Formats von der auf das andere Format spezialisierten Software auf die gleiche Weise dargestellt wird. Die Studie weist aber auch darauf hin, dass hierbei nicht nur die Formatunterschiede eine Rolle spielen, sondern auch die “Rendering Engine” der Grafik und die verwendete Hardware.

Rechtsstreit um XML in Microsoft Word

Wegen Verletzung eines Software-Patents für eine XML-Technik aus dem Jahr 1998 hat ein Bezirksgericht in Texas eine einstweilige Verfügung gegen Microsoft erlassen. Das Unternehmen soll binnen 60 Tagen den USA-Vertrieb von Microsoft Word in den Versionen 2003 und 2007 einstellen und dem kanadischen Patentinhaber i4i eine Entschädigung von 200 Millionen Dollar zahlen. Ein Patent auf [...]

weiterlesen »

Die Grenzen von Office Open XML…

… macht das neue Office 2008 für Mac sichtbar. Dateien, die im neuen Standardformat von Office 2007 unter Windows gespeichert wurden, kann Microsoft Office 2008 auf dem Mac nicht oder nur unvollständig anzeigen. Im Formatstreit mit dem Open Document Format (ODF) der Open-Source-Gemeinschaft hat Microsoft die Entwicklung von Office Open XML (OOXML) gerade damit begründet, [...]

weiterlesen »


XMLSpy baut Unterstützung für OOXML aus

In der Version 2008 hat der XMLSpy von Altova seine Unterstützung für Office Open XML (OOXML) noch einmal ausgebaut. Neben den Word- und Excel-Dateien kann die Anwendung nun auch mit Powerpoint-Dateien umgehen. Das konkurrierende Open Document Format (ODF) der Open-Source-Szene wird hingegen nicht unterstützt. Dazu befragt hat Altova-Gründer und Vorstandsvorsitzender Alexander Falk ausführlich in einer [...]

weiterlesen »

Microsoft schlägt Brücke zu ODF

Bisher hat Microsoft strikt an seiner eigenen XML-Umsetzung für Dokumentenformate festgehalten. Dieses Format namens Open XML mit den Datei-Endungen docx (Word) oder xlsx (Excel) soll Standard im neuen Office 2007 werden, das für Anfang 2007 angekündigt ist. Auf Druck der Kundschaft vor allem im Regierungslager schlägt der Software-Konzern jetzt aber eine Brücke zum Open Document [...]

weiterlesen »


aus doc wird docx

Auch der Software-Marktführer hat längst erkannt, dass es für Dokumente aller Art kein besseres Format gibt als XML. Erstmals unterstützt wurde XML in dem 1999 eingeführten Office 2000. Sehr viel weiter reicht die XML-Umsetzung in dem zurzeit entwickelten Office 12. Diese Version führt neue Standardformate ein: Aus doc wird docx, aus xls wird xlsx, und [...]

weiterlesen »


Copyright © 2010 by: XML-Ecke - Lizenz: Creative Commons BY-NC-SA.