Oskar Welzl: Weblog zur Homepage

RDFa à la twoday, Teil II

Semantic Web Logo 2008 habe ich zum ersten Mal versucht, maschinenlesbare Zusatzinformationen nach der (damaligen) RDFa-Spezifikation in ein twoday.net-Blog einzubauen - und bin kläglich gescheitert. In den letzten Monaten hat sich aber einiges getan: RDFa 1.1 wird sich, das ist abzusehen, wesentlich von der 2008 gültigen Version 1.0 unterscheiden und dadurch technische Probleme aus dem Weg räumen. Außerdem gibt es neue Antworten auf die Frage nach dem „Warum?“. Wo also stehen wir 2012? Und was könnte ich für mein Blog hier verwenden?

Ich habs im RDFa-Testblog von 2008 ausprobiert. Was eine Maschine daraus lesen kann, wird in diesem Diagramm sichtbar. Ziemlich beeindruckend, finde ich. Aber sehen wir mal im Detail, was für mich neu war:

Vorweg: Alle folgenden Aussagen zum „neuen“ RDFa beziehen sich auf eine Version 1.1, die noch nicht als offizielle W3C-Empfehlung vorliegt. Noch wird daran gefeilt - sehr heftig sogar. Ich gehe aber davon aus, daß der Editor’s Draft vom 15.12.2011 dem Ergebnis sehr nahe kommen wird … sofern es überhaupt ein Ergebnis gibt, doch dazu später.

  • RDFa verläßt sich nicht mehr auf den XML-spezifischen Mechanismus der Namensraum-Deklaration, um ein Vokabular einzuführen. Das ist zwar deutlich weniger elegant, ermöglicht aber die Nutzung in Dokumenten, die kein XML sind - wie z.B. in twoday.net-Blogs. Heißt: Ich konnte im Testblog RDFa einbauen ohne mich darum zu kümmern, ob die ganze Tagsoup drumherum irgendeinem (X)HTML-Standard entspricht. Tatsächlich habe ich das Ergebnis von neuen RDFa-Parsern lesen lassen, es funktioniert.
  • Die Autoren von RDFa haben unter dem Namen „RDFa Lite“ ein Subset definiert, das in seiner Funktionalität sehr stark an das von der Industrie bevorzugte Microdata-Modell erinnert. Microdata ist simpler, aber zentralistischer, weniger leistungsfähig und vor allem weniger flexibel als RDFa. Wahrscheinlich wird es aber für RDFa wichtig werden, eine Microdata-ähnliche, allgemein anerkannte Mindestvariante anbieten zu können. Im Testblog habe ich einfach versucht, möglichst konform zu RDFa Lite zu bleiben (und somit implizit auch „in Microdata zu denken“). Das ist mühsam und umständlich, wenn man RDF gewöhnt ist. Außerdem schränkt es die Möglichkeiten doch sehr ein: Die Einfachheit kommt nicht ohne Preis, manches läßt sich in „Lite“ einfach nicht mehr ausdrücken.
  • Im Juni 2011 mußten die um ein semantisches Web bemühten Personen und Organisationen zunächst einen herben Rückschlag einstecken: Mit schema.org haben Google und andere Suchmaschinenbetreiber das Rad neu erfunden und ein auf Microdata basierendes Vokabular vorgestellt, das alle bestehenden völlig ignoriert. Ein Licht am Horizont gibt es erst wieder seit November: RDFa Lite soll von den Suchmaschinenbetreibern gleichberechtigt mit Microdata als Syntax anerkannt werden - solange das schema.org-Vokabular verwendet wird. In der Praxis könnte das bedeuten: Eine Website verwendet volles RDFa 1.1 (also nicht nur die lite-Version) mit etablierten Vokabularen (SIOC, Dublin Core, FOAF, …) und den Ausdrücken aus schema.org. Die großen Suchmaschinen lesen nur, was als RDFa Lite gültig ist und schema.org-Vokabeln enthält, während alle zusätzlichen Informationen für fortgeschrittene RDF-Anwendungen unverändert erhalten bleiben. Ob Google tatsächlich schon RDFa 1.1 Daten aus meinem Testblog liest, bezweifle ich erst mal. Wahrscheinlich warten die, bis die Spezifikation engültig fest steht.

Apropos bis die Spezifikation engültig fest steht: Spannend wird, wie sich das W3C aus der Sache mit den konkurrierenden Standards RDFa und Microdata herauswindet. Es gibt Bestrebungen, die Veröffentlichung beider Spezifikationen zu unterbinden und darauf zu warten, daß die beiden Gruppen sich einigen. Andererseits wäre es nicht das erste Mal, daß zwei Standards parallel existieren, die mehr oder weniger dem gleichen Zweck dienen.

Wenn sich die Geschichte wiederholt, wird der schlechtere Ansatz (Microdata) sich gegen den überlegenen (RDFa) durchsetzen … so wie sich „HTML“ 5 durch die Macht der Konzerne gegen das wesentlich brilliantere XHTML 2 durchsetzen konnte. Noch ist aber nicht alles verloren. Der Kunstgriff mit „RDFa Lite“ könnte noch einiges ändern. Mal sehen.

Einen guten Überblick über den aktuellen Status von RDFa bietet Ivan Herman im Artikel Where we are with RDFa 1.1?. Eine Gegenüberstellung von RDFa, Microdata und den etwas in Vergessenheit geratenen Microformats hat Manu Sporny unter dem Titel An Uber-comparison of RDFa, Microdata and Microformats veröffentlicht.

 
Weitere Links zu …
RDF:
development