XML-Ecke

Struktur in den Content!

Google und Bing wollen mehr Semantik im Web

Mehrere Suchmaschinen haben ein eigenes Vokabular entwickelt, um mit semantischen Ergänzungen der HTML-Struktur einer Webseite die Qualität der Internet-Suche zu verbessern. Die Initiatoren von schema.org – unter ihnen Google, Bing und Yahoo – fordern die Anbieter von Web-Inhalten auf, diese Ergänzungen in ihre Dokumente einzufügen, “um es den Nutzern einfacher zu machen, relevante Informationen im Web zu finden”. Bei den Festlegungen von schema.org handelt es sich um Mikrodaten: Diese maschinenlesbaren Tags innerhalb des HTML5-Standards verstehen sich als einfachere Alternative zu RDFa, der HTML-Umsetzung des (Resource Description Frameworks), aber auch zu Mikroformaten wie XFN.

Das Vokabular umfasst zunächst eine relativ schlichte Hierarchie von Datentypen und “Dingen” (Things) mit lediglich sieben Kategorien: CreativeWork, Event, Intangible, Organization, Person, Place und Product. Der gesamte Bereich der Natur kommt in diesem Vokabular zunächst nicht vor. Für Erweiterungen des Vokabulars nennt schema.org Empfehlungen und erklärt, dass sinnvolle Erweiterungen in das Kernvokabular von schema.org übernommen werden können.

Die Mikrodaten werden als Attribute zu den Tags div und span angegeben. Ähnlich wie im RDF-Konzept werden sie in Form eines URI (Uniform Resource Identifier) angegeben:

<div itemscope itemtype="http://schema.org/Event"><!-- URI für den Item-Typ "Event" -->
<div itemprop="name">Pressekonferenz</div>
<span itemprop="description">Vorstellung von schema.org</span>
  Termin:
<time itemprop="startDate" datetime="2011-06-07T19:30">  7. Juni 2011, 19.30 Uhr <!-- HTML5-Tag time -->
</div>

Google hat ein Online-Tool bereitgestellt, um die erweiterte Auszeichnung mit schema.org-Attributen zu testen. Das Vokabular hat bislang die Versionsbezeichnung 0.9 – eine erste finale Version soll im Laufe dieses Jahres kommen.

Posted in Im Lauf der Zeit | Tagged , , , , | 1 Comment