Antwortmaschinen, Entscheidungsmaschinen und Google-Killer: Die Verheißungen des semantischen Webs bleiben bislang aus

Die "Entscheidungsmaschine"Power-Blogger Sascha Lobo wünschte sich in einem Interview für die Weiterentwicklung des Internets eine sinnvollere Vernetzung der Inhalte untereinander: „Ich warte seit Jahren auf den Durchbruch des für das jeweils übernächste Jahr angekündigten Semantic Web“, so Lobo. Die Web-Welt wird nun schon seit einiger Zeit mit den Verheißungen der semantischen Technologien auf Hochtouren gebracht. Jüngstes Beispiel ist die als Google-Killer titulierte Antwortmaschine „Wolfram-Alpha“ vom Mathematik-Genie Stephen Wolfram. Er selbst sieht sein Tool eher als wissenschaftlichen Hausgeist für die akademische Welt. Ehrgeizige Ziele verfolgt auch Microsoft mit „Bing“: Der Software-Konzern spricht sogar von einer Entscheidungsmaschine. So soll eine Suchanfrage, die nur eine Flugnummer enthält, mit aktuellen Informationen zu diesem Flug beantwortet werden. Die Eingabe von „Wetter München“ führt nach Microsoft-Angaben zu einer Wettervorhersage der bayerischen Hauptstadt.

Microsoft hat semantische Technologien des zugekauften Startups Powerset eingebaut. Die „Antwort- und Entscheidungsmaschinen“ sollen den Kontext der Anfrage verstehen und nicht nur eine Flut von Links auswerfen. Sie sollen verstehen, welche anderen Begriffe verwandt sind oder innerhalb eines Wissensnetzes in der Nähe liegen. Bislang funktioniert das nur in sehr abgegrenzten Themenfeldern. Semantische Suchmaschinen mit allgemeiner Ausrichtung sind nach einem Bericht der Wochenzeitung „Die Zeit“ bis jetzt ohne größeren Erfolg geblieben: „Da macht Google immer noch das Rennen. Zumal die Google-Programmierer ihrem Algorithmus immer neue Feinheiten hinzufügen; neuerdings lässt sich beispielsweise der Zeitraum der Suche eingrenzen“. Bei allen anderen Ansätze kommen „Tags“ zum Tragen, von den Nutzern selbst eingespeiste Schlagworte. „Eine Software analysiert diese dahingehend, inwiefern sie sich mit Inhalten von Websites decken. Wie bei den Wissensnetzen von Conweaver geht es darum, Zusammenhänge herauszufiltern“, schreibt „Die Zeit“.

Das alleine reiche allerdings nicht aus, so der Einwand von Andreas Klug, Vorstand von Ityx in Köln. „Moderne Ansätze der semantischen Informationsbewertung benötigen kein manuelles ‚Tagging’. Sie beziehen das explizite und implizite Verhalten der User bei der Informationssuche dynamisch in die Optimierung des Wissens ein. Im Klartext heißt das: ein Verschlagworten von Informationsobjekten ist längst nicht mehr notwendig. Durch die Verknüpfung zwischen Suchbegriffen und bewerteten Inhalten wird eigenständig Wissen generiert. Dabei kann sowohl die aktive Bewertung der Antworten wie das bloße Betrachten von Objekten deren Relevanz dynamisch beeinflussen“, erläutert Klug. Der Nutzen semantischer Methoden wachse durch die Abgrenzung von Informationen in sogenannten „Wissensräumen“. „Diese abgegrenzten Domänen bilden schnell Wissen ab, wenn viele Anfragen zu einem abgrenzbaren Themenkreis in kurzer Zeit verarbeitet werden können. Der große Wurf wird aber mit den lernfähigen Methoden gelingen“, ist sich Klug sicher.

Sein Unternehmen entwickelt in Kooperation mit deutschen Forschungseinrichtungen Kombinationen von semantischer, soziolinguistischer und dynamisch lernfähigen Methoden. Sie werden vor allen Dingen in mittleren und großen Unternehmen für die Informationsbewertung von Posteingängen und Archiven eingesetzt. „Große Unternehmen beschäftigen sich schon seit Jahren mit dem Thema Datenmengen für Maschinen besser analysierbar und verständlicher zu machen. Der Ansatz des semantischen Web birgt daher wesentlich mehr Potential als die häufig diskutierte Verbesserung von Suchalgorithmen oder das menschliche Tagging von Inhalten in der stetig wachsende Anzahl an Internetseiten, die derzeit Google als Platzhirsch mit sinkendem Erfolg indiziert und cached“, sagt Björn Behrendt, Geschäftsführer der Wissenscommunity Hiogi.

Wenn sich W3C-Standards für die einheitliche Beschreibung von Daten eines Tages durchsetzen, könnten daraus völlig neue Anwendungsgebiete entstehen. „Vor allem Unternehmen werden in der Lage sein, die Daten ihrer Abteilungen für Forschung und Entwicklung sowie Zulieferer auf völlig neue Weise technisch verwertbar und austauschbar zu machen. Wir sollten hierbei nicht vergessen, dass ein wesentlicher Schlüssel zum Erfolg die effektive und sichere Verlinkung von Daten ist http://linkeddata.org/. Mashups und offene APIs zeigen heute bereits, wie aus der Verknüpfung von Daten neue Anwendungsgebiete entstehen“, weiß der Hiogi-Chef. Es sei kaum auszumalen, wo wir landen werden, wenn Softwaresysteme diese ausgetauschten Daten logisch zu Metathemen zusammenfassen können und inhaltliche oder aber auch gefühlstechnische Zuordnungen und Empfehlungen automatisch treffen könnten. „Ich teile daher die Skepsis gegenüber den semantischen Suchmaschinen. Es wird keinen Google-Killer geben. Bei Unternehmensdaten, APIs, Applikationsentwicklung, Contextual Advertising, Profiling und damit im E-Commerce sind die Potentiale von verlinkten Daten gigantisch“, verkündet Behrendt.

Wahrscheinlich sind umfassende semantische Systeme im Web eine Utopie. „Nach der Theorie muss man zwischen statischer und dynamischer Semantik unterscheiden. Semantik ist nicht immer statisch. Eine Aussage kann einem Sachverhalt auch eine neue Bedeutung geben. Schon das Lesen von Forenbeiträgen und die Antworten darauf machen klar, wie schnell sich die Semantik ändern kann, das Thema oder der logische Zusammenhang verloren gehen oder durch neue Bedeutungen ersetzt werden“, erklärt Udo Nadolski vom IT-Beratungshaus Harvey Nash. Das könne man nicht generell anwenden oder mit einem Regelwerk festlegen. Semantische Analysen und Verknüpfungen werden nur da funktionieren, wo der tatsächliche und der vermutete Erwartungshorizont der Anwender deckungsgleich sind“, resümiert Nadolski.

Google-Killer oder: Wer Antworten will, braucht auch Fragen

Auch die NZZ hat sich mit dem vermeintlichen Google-Killer beschäftigt, der zur Zeit über Blogs kräftig ins Rampenlicht gerückt wird. „Derjenige, der da Google übertrumpfen und mittels künstlicher Intelligenz allem Unwissen den Garaus machen will, wurde als wissenschaftliches Wunderkind bekannt, hat sich an den besten Universitäten hervorgetan und hat als Programmierer eine technisch komplexe, kommerziell erfolgreiche Software geschaffen. Es ist der Ruhm des britischen Physikers Stephen Wolfram, der dieser Tage unzählige Online-Journalisten und Blogger dazu bringt, die Begriffe Google-Killer, neuartige Suchmaschine, künstliche Intelligenz wieder einmal in einem Satz zusammenzubringen“, so die NZZ. Ob Wolfram-Alpha halten kann, was Blogger vermuten, steht auf einem anderen Blatt. Der Suchmschinen-Genius selbst beschreibt die neue Suchmaschine als „computational knowledge system“, als Wissensberechnungsmaschine. „Ausserhalb von Wolfram Research, der Firma, die Mathematica und Alpha entwickelt, hat bis jetzt nur ein einziger Mensch – Nova Spivack – die neue Suchmaschine ausprobieren können“, schreibt die NZZ. Das ist doch ein kluger PR-Schachzug. Spivack ist so euphorisch, als sei eben gerade eine neue bewusstseinserweiternde Droge entdeckt worden: Wolfram Alpha sei nicht eine Suchmaschine, sondern eine Antwort-Maschine. Das ist aber keine Sensation. Denn auch KI-Forscher wie Professor Wolfgang Wahlster vom DFKI oder das Fraunhofer Institut drehen an dieser Schraube. Darüber habe ich schon mehrfach berichtet. Und auch die Semantic Web-Experten von Google verweilen nicht im Tiefschlaf. Mit Mike Cohen, seinen früheren Nuance-Mitarbeitern, Franz Och und vielen anderen Spezialisten hat Google einige gute Leute an Bord.

Schon jetzt sei Google gar nicht so schlecht, meint die NZZ. Auch diese Suchmaschine kann schwierige Fragen mit wenigen Ziffern beantworten. Füttert man Google beispielsweise mit der Frage aller Fragen, der allerletzten Frage, und schreibt: ‚The answer to life, the universe and everything‘, erhält man als Antwort: ’42‘. Wie man beim englischen Science-Fiction-Autor Douglas Adams nachlesen kann, ist diese Antwort korrekt, dies sei tatsächlich die allerletzte Antwort“. Allerdings gerate in Vergessenheit, welches die dazu passende allerletzte Frage war. So werde man dann halt vielleicht Wolframs Answer Machine eine Frage-Maschine zur Seite stellen müssen, orakelt die NZZ und hat nicht ganz Unrecht. Siehe auch meinen Blog-Beitrag vor ein paar Tagen.