XML-Ecke

Struktur in den Content!

eXist bringt XML-Daten zum Tanzen

eXist SandboxViele Datenbank-Programme können XML-Dokumente “mappen”, das heißt in ihre eigene Struktur übertragen und so für Abfragen aufbereiten. Bei “nativen” XML-Datenbanken entfällt diese Umwandlung, sie werden denn auch nicht wie relationale Datenbanken mit SQL bedient, sondern mit XML-Werkzeugen wie dem Standard XQuery. Eine besonders interessante XML-Datenbank ist das Open-Source-Projekt eXist, in der jetzt vorgelegten Version 1.4 ist sie schneller und leistungsfähiger geworden.

Die Entwickler um Wolfgang Meier von der TU Darmstadt haben die Datenbank vollständig in Java programmiert. Das jar-Paket wird im Terminalfenster (Linux/Mac) oder auf der Windows-Befehlszeile installiert und mit einem Skript gestartet. Zusammen mit eXist wird auch ein Web-Server (Jetty) gestartet, der die Datenbank im Browser aufruft. Beim ersten Mal können dabei auch mehrere Beispielanwendungen aufgerufen werden, darunter ein Abkürzungsverzeichnis für XML-Techniken und eine Volltextsuche für Shakespeares Werke.

Eine “Sandbox” enthält unterschiedliche XQuery-Abfragen, die beliebig variiert werden können. Mit der im Beispiel im Eingabefenster gezeigten Anweisung nach dem Muster

doc(“URL”)//root_element[element = 'searchTerm']

können beliebige XML-Dokumente auf einem Server abgefragt werden. Einzelne Abfragen lassen sich in “Slots” speichern. Das eXist-System eignet sich damit auch besonders gut, um XQuery zu lernen.

Die Datenbank bringt XML-Daten zum Tanzen – sei es auf einer CD-ROM etwa für Archivzwecke oder als Web-Anwendung. Zur Beschleunigung von Abfragen erstellt eXist einen Index der eingebundenen XML-Datenbank. Um eXist zu nutzen, muss man die Datenbank noch nicht einmal selbst erstellen – die Sandbox kann auch online aufgerufen und mit Anweisungen für Beispieldatenbanken oder andere XML-Dokumente im Web gefüttert werden. Den Zugriff auf externe Datenquellen demonstriert auch ein Twitter-Client.

Posted in Im Lauf der Zeit | Tagged , | Leave a comment