Sprachcomputer und die Forschung für Künstliche Intelligenz: Projekte, die unser Leben verändern werden

100 ProdukteUnternehmen und Wissenschaft in Deutschland sind bei der Entwicklung von automatischen Sprachdialog-Systemen nach Auffassung von Voice Days plus-Sprecher Bernhard Steimel auf einem guten Weg und international sogar an der Weltspitze. „So zählt der Physik-Nobelpreisträger Theodor Hänsch das SmartWeb-Projekt von DFKI-Leiter Professor Wolfgang Wahlster zu den 100 Produkten der Zukunft , die unser Leben verändern werden – das ist sicherlich kein Zufall“, sagt Steimel.

So wollen Wissenschaftler das Auto zum mobilen Informationszentrum machen. „Das SmartWeb-Auto macht dem Nutzer das Leben besonders leicht, weil es die Informationen auf Nachfrage in gesprochener Sprache liefert. Eine Reihe von Sensoren sammeln Daten rund um das Auto, die durchaus in der Lage sind, eine Gefahrenstelle, etwa eine glatte Fahrbahn, zu erkennen. Ist das der Fall, wird nicht nur der Fahrer des Wagens gewarnt, sondern auch die Insassen nachfolgender Fahrzeuge werden informiert. Das System ergreift das Wort und leistet aktive Hilfe“, erklärt Wahlster.

Eine weitere Informationsquelle sei das Internet. Via Spracheingabe könne man nach Daten fragen, egal ob es um die letzten Fußballergebnisse gehe oder um die aktuelle Presseschau. „Im Vordergrund stehen jedoch sicherheitsrelevante Informationen. Sie reichen von Warnhinweisen und Staumeldungen bis zur Unterstützung bei der Parkplatzsuche. Die Informationen werden dem Fahrer als digitales Radiosignal übermittelt. Die Kommunikation mit dem Internet wird im Wagen über ein Bordgerät koordiniert. Dieses Instrument greift nicht bei jeder Nachfrage direkt auf das Internet zu. Es lädt vielmehr die Information einmal herunter und aktualisiert sie von Zeit zu Zeit. So wird der Zugriff auf Daten möglich, ohne ständig kostenpflichtige Mobilfunk-Verbindungen nutzen zu müssen“, so Wahlster.

Siehe auch:Künstliche Intelligenz zählt schon längst zur Alltagstechnologie

Topsy, Crowdeye, Hunch oder Eyeplorer: Auf der Suche nach der Suchmaschine von morgen

logo_ask_new_2Anders als in den vergangenen Jahren, in denen auch qualitativ hochwertige Suchdienste wie Ask.com beharrlich ignoriert wurden, scheint die Bereitschaft zu wachsen, bei Suchmaschinen sich auf etwas Neues einzulassen. Das schreibt Spiegel-Online-Redakteur Frank Patalong: „Was auch daran liegen könnte, dass wahrgenommen wird, dass Google nicht in jeder Hinsicht das Rad erfunden hat. So wird eifrig über die Entwicklung einer Twitter-Suchmaschine im Hause Google spekuliert. Die müsste dann aber wohl gegen den Twitter-Suchdienst CrowdEye.com des langjährigen Microsoft-Suchdienstentwicklers Ken Moss antreten“. Moss sei kein Frühstarter.
„Längst haben sich mit OneRiot und Topsy zwei Twitter-Suchdienste etabliert. Der Vorgang ist typisch: Erst, wenn sich die Großen bewegen, entsteht auch Aufmerksamkeit für die Leistungen der Kleinen. Während die Tech-Presse erneut über semantische Suche diskutiert, probieren Dienste wie Hunch.com neue Ansätze, das Web intelligenter zu erschließen. Hunch versucht, Suchanfragen durch thematische Einengung näher zu definieren, um zu treffsichereren Ergebnissen zu kommen. Mitunter klappt das ganz prächtig und zeigt viel Potenzial, mitunter grenzt es an Realsatire“, so Patalong.

Internet intelligenter erschließen
Internet intelligenter erschließen
Hunch sei das Gegenstück zu Wolfram Alpha (WA), dem Dienst, der wenig, das aber sehr genau weiß: „WA ist stark, wo es um Sachliches geht, Hunch dort, wo es nach Pop riecht – sie sind E- und U-Suchmaschinen, wenn man so will. Aber Hunch lebt vom Konzept, durch seine Nutzer zu lernen. Man muss der Sache also Zeit geben. Das sind die Dinge, die dafür sorgen, dass die wirklich großen Suchdienste populär bleiben. Mitunter haben die Kleinen mehr Klasse, doch es fehlt an Masse“, führt Patalong aus. Bemerkenswertes verortet er in Berlin: Eyeplorer.com sei ein Dienst, der für semantische Verbindungen sorgt. Auf Basis der erfassten Wikipedia-Daten visualisiere EyePlorer thematische Querverbindungen. Man komme zu überraschenden Ergebnissen. Der Nutzer wird auf Themenreisen durch Cluster von Artikeln geführt, die thematisch verknüpft sind. „So etwas für das gesamte Web umzusetzen, statt ‚nur’ für die Inhalte der Wikipedia, würde dem Traum vom semantischen Web schon sehr nahe kommen. Denn da geht die Reise hin, für alle Player auf dem Markt: Keine Frage, dass auch Google, Yahoo oder nun Bing versuchen werden, immer mehr solche semantischen Features in ihre Dienste zu integrieren“, resümiert Patalong.

Die Inhalte im World Wide Web wachsen allerdings mit einer schnellen Geschwindigkeit. In Zukunft werde eine Indexierung immer schwieriger, selbst wenn man neuartige Methoden auf Basis von semantischen Verbindungen oder künstlicher Intelligenz auf den Markt bringt, meint Björn Behrendt, Geschäftsführer der Wissenscommunity Hiogi. „Wirklich mächtige Suchmaschinen können meiner Ansicht nach erst dann entstehen und Zusatznutzen stiften, wenn sich die Spezifikationen des World Wide Web Consortium (W3C) in der Breite durchsetzen. Mit anderen Worten müssen die großen Softwareanbieter bei der programmiertechnischen Kennzeichnung semantisch verwertbarer Inhalte eine Vorreiterrolle übernehmen“, erklärt Internetexperte Behrendt.

Neue Dienste durchs mobile Internet
Neue Dienste durchs mobile Internet

Impulse erwartet Sprachdialogexperte Lupo Pape vom mobilen Internet: „Das mobile Internet ist erst in Ansätzen erkennbar. Da ist vor allen Dingen in Europa noch sehr viel Marktpotenzial vorhanden. So kann niemand vorhersagen, was passiert, wenn beispielsweise ortbasierte Services auf auf Web 2.0-Communities treffen. Natürlich hat das eine enorme Sprengkraft wenn Giganten wie Apple, Google, Microsoft und Nokia aufeinander treffen und gleichzeitig noch Heerscharen von Applikationsentwicklern auf deren freigegebenen Plattformen innovative Dienste für den mobilen Nutzer entwickeln und täglich neue Dienste auf den Downloadcharts vom Apple-Store oder OVI stehen“, erläutert Pape, Geschäftsführer von SemanticEdge in Berlin.

Die Innovationsgeschwindigkeit verlaufe zur Zeit ungehemmt, keiner weiß, wo das hinführen wird und wie sich unser Leben und wie sich insbesondere auch die Wertschöpfungsketten in der Wirtschaft verändern werden. „Interessant ist, dass trotz der ganzen Vielfalt der Software, Hardware und Anwendungen, die sich dahinter verbergenden Nutzungsszenarien der Endverbraucher meist sehr einfach bleiben: ‚Wo ist der nächste Fahrradladen?’; ‚Welche Freunde sind gerade in der Nähe?’; ‚Wie gut ist der Inder dort an der Ecke?’; ‚Gibt es die Kamera noch irgendwo billiger?’“, so der Sprachdialogexperte Pape. Das seien Nutzungsszenarien, die nach einer Spracherkennung und einem Sprachdialog geradezu schreien.

„Wenn es gelingt, den Sprachdialog in die mobilen Anwendungen einzubinden, dann wird die ganze Entwicklung noch einmal eine neue Dimension bekommen. Spracherkennung und Sprachdialog werden auch der Schlüssel dafür sein, Bevölkerungsgruppen an der Entwicklung teilhaben zu lassen, die von der neuen Technologie bisher ausgeschlossen sind“, resümiert Pape. Das müssten die großen Anbieter in ihren Strategien für das mobile Internet berücksichtigen.

Sprachcomputer brauchen mehr Dialogintelligenz – Warum Tonwahlsysteme nerven

Klassische Sprachautomaten sind für viele Verbraucher ein Ärgernis. Wenn Firmen schlechte Systeme anbieten, würde das einen schlechten Eindruck beim Kunden hinterlassen, so Professor Elmar Nöth, Experte für Sprachverarbeitung an der Friedrich-Alexander-Universität Erlangen-Nürnberg, gegenüber dem Fachmagazin „Direktmarketing“: „Der Mensch soll sich aber nicht auf die Maschine einstellen, sondern die Maschine auf den Menschen. Billige Systeme führen zu genervten Leuten, und das ist schlecht für Kunden und Unternehmen.“

Sprachautomaten brauchen daher eine sehr ausgefeilte Dialogintelligenz. Davon ist Lupo Pape, Geschäftsführer von SemanticEdge in Berlin, überzeugt. Sprachsysteme sollten nicht nur die Fähigkeit besitzen zu sprechen, sondern müssten sich auch auf das Gesagte einstellen können. Der Anrufer gibt Anweisungen oder stellt Fragen, die vom Computer befolgt oder beantwortet werden. Noch weiter gehen Entwicklungen, die den Anrufer erkennen, seine Emotionen heraushören und sich entsprechend anpassen können. „Die Personalisierung der Dialogsysteme ist ein wichtiger Schritt, um Kundenwünsche vorausahnen zu können auf Basis der Kundendaten. Dann sind differenzierte Services und Auskünfte möglich, je nachdem wer, wann und wo anruft“, erläutert Pape. Der Dialog laufe dann wie folgt: Hallo Herr Herrmann! Oh! Ich sehe, dass Sie in letzter Zeit mehrfach versucht haben sich einzuwählen. Möglicherweise haben Sie Probleme mit…

Die alten Tonwahl-Systeme, drücken Sie die 1, wenn Sie ein Problem mit Ihrem Drucker haben, drücken Sie die 2, wenn Sie eine Frage zu neuen Produkten haben, seien nicht mehr zukunftsfähig. „Diktiererkenner werden immer besser und auch die Dialogtechnologie macht enorme Fortschritte. Die Systeme können viel mehr verstehen und die Dialoge werden immer natürlicher“, so Pape zur Weiterentwicklung der Sprachsteuerung. Interessante Dinge könnten in der mobilen Welt passieren. Der Dienst „Google Voice Search“ habe das Potential, sich zu einem persönlichen Assistenten zu mausern.

Bei Anruf Verbraucherzorn! Call Center brauchen Qualitätsstandards

Bei Anruf Verbraucherzorn
Bei Anruf Verbraucherzorn
Das aktuelle Marktvolumen für den externen Einkauf von Call Center-Dienstleistungen beträgt jährlich rund zwei Milliarden Euro. Während telefonischer Service für Dienstleister schon seit geraumer Zeit unverzichtbar sind, bieten auch Industrieunternehmen ihren Kunden immer häufiger telefonische Kontaktmöglichkeiten an.

ccb_logoTrotz des hohen Einkaufsvolumens mangelt es nach Auffassung von Experten an Preistransparenz. Auch die jeweils gebotene Servicequalität und die Serviceanforderungen bei der Auftragsvergabe spielen hier eine zentrale Rolle. Sie werden in Deutschland bisher noch in keiner regelmäßigen Erhebung erfasst. Aus diesem Grund führt der Bundesverband Materialwirtschaft, Einkauf und Logistik (BME) gemeinsam mit dem internationalen Call Center-Unternehmensverband CCBenchmarks im deutschsprachigen Raum eine detaillierte und umfassende Erhebung zum Einkauf von Call Center- Dienstleistungen durch.

Der neue Preis- und Qualitätsindex ermögliche Einkäufern, Preise und Qualitäten präzise miteinander zu vergleichen. So werden bei den Preisabfragen zu In- und Outbound jeweils 15 unterschiedliche Anruftypologien abgefragt. „Darüber hinaus enthält die Studie viele wertvolle Informationen rund um den Einkauf von Call Center Dienstleistungen. Dies reicht von Bewertungsmethoden für die Servicequalität bis zu den von den Unternehmen primär genutzten Kriterien für die Auswahl von Call Center-Dienstleistern“, teilen BME und CCBenchmarks mit.

Studie zur Akzeptanz von sprachgesteuerten Telefondiensten
Studie zur Akzeptanz von sprachgesteuerten Telefondiensten
Messbare Qualitätsnormen sind nach Auffassung von Bernhard Steimel, Sprecher der Voice Days plus, auch bei der Sprachcomputern vonnöten. „Seit 2007 wird deshalb in Kooperation mit dem Fraunhofer-Institut für Arbeitswirtschaft und Organisation und Experten der deutschsprachigen Fachszene ein industrienaher Standard für Sprachapplikationen erarbeitet“, so Steimel.

Die Ergebnisse der ersten Projektphase wurden in der Studie „Leitfaden – Qualitätskriterien für Sprachapplikationen“ veröffentlicht: „Als Unternehmen, das seit acht Jahren und von Anfang an auf die Nutzung von Spracherkennung und die Verfolgung innovativer natürlichsprachlicher Designansätze gesetzt hat, sehen wir uns in der Verantwortung, einen Beitrag zur Konsolidierung und zur weiteren Entwicklung der Branche insgesamt zu leisten“, erläutert Jörn Kreutel, Chief Technology Officer bei SemanticEdge in Berlin.

Auch wenn die Nutzung von Spracherkennung gegenüber dem Tonwahlverfahren DTMF (Geben Sie die 1 ein, wenn….) klar überlegen sei, müsse man immer noch Vorbehalte in der Öffentlichkeit ausräumen. Dazu seien die Maßstäbe des Fraunhofer Instituts, die sich auch in anderen Technologiefeldern bewährt hätten, ein wichtiger Beitrag: „Für die Branche und auch für uns selbst als Marktteilnehmer“, resümiert Kreutel.

Wer an der BME/CC-Benchmarks-Erhebung teilnehmen möchte, kann sich an Volkmar Klein wenden: volkmar.klein@bme.de. Teilnehmer der Studie erhalten kostenfrei eine Zusammenfassung der Analyse. Die Veröffentlichung der Studie „Einkauf von Call Center-Dienstleistungen“ ist zum 30. September 2009 geplant.

Link zum Qualitätsleitfaden für Sprachcomputer.

Weitere Blog-Beiträge:
Call Center auf der Hitliste des Zorns

Virtuelle Call Center

Intelligente Software-Assistenten

Dumme Kundeninteraktion

Sprachsteuerung als Dialogmanager für mobile Geräte

Die Kommunikation zwischen Mensch und Maschine wird nach Expertenmeinung vor allen Dingen durch die mobile Spracherkennung vorangetrieben. So geht Datamonitor in der Studie „The Proliferation of Innovative Speech Applications in Mobile Computing“ davon aus, dass sich die Sprachsteuerung von Handsets in den kommenden fünf Jahren verdreifacht: von 32,7 Millionen US-Dollar auf 99,6 Millionen US-Dollar. In Fahrzeugen geht man von einer Steigerung von 64,3 Millionen auf 208,2 Millionen aus. Als wichtigen Wachstumsfaktor sieht das CIO-Magazin die immer besseren Netzwerke, die zu neuen Wegen bei der Sprachübertragung führen. „Der Trend scheint zu einer Mischung aus netzwerkbasierter und eingebetteter Sprache zu gehen, mit der man beispielsweise das Menü steuern und eine Internetsuche durchführen kann“, so die Fachzeitschrift. Vor allem bei Arbeitnehmern im Außendienst und in Lagerhallen würde sich die Nützlichkeit der Sprachsteuerung erweisen. Die Datamonitor-Studie berichtet von positiven Erfahrungen von Betreibern von Lagern, deren Mitarbeiter ihre Konzentration dank der mobilen Spracherkennung nicht von Tätigkeiten wie dem Heben von Gegenständen abwenden mussten. Ein Wachstumsmarkt sei auch das Gesundheitswesen und hier vor allem die Altenpflege. Bei gleich bleibenden Budgets müssten immer mehr alte Menschen betreut werden.

Die von der Berliner Firma Aastra-Detewe entwickelte Sprachtechnologie soll Pflegedokumentationen in der stationären Altenhilfe einfacher, schneller und besser machen: „So ist eine Nachtschwester für viele Bereiche und Bewohner zuständig und kann nicht alle Akten ständig bei sich tragen. Die Spracherfassung über das mobile Telefon vereinfacht die Dokumentation, sichert die Qualität und spart nebenbei noch Zeit“, erklärt Andreas Latzel, Deutschlandchef der Aastra-Gruppe. Aastra-DeTeWe kombiniere interaktive Anwendungen auf DECT-Mobiltelefonen mit einem speziell von Pflegewissenschaftlern angepassten Sprachportal. So werden alle Eingaben in Echtzeit überprüft und direkt in einer elektronischen Patienten-Akte abgelegt. Bei einem Pflegeheim mit etwa 100 Mitarbeitern und einer durchschnittlichen Fluktuation setzt Aastra-DeTeWe auf Sprachportale. Bei ihnen können interaktive Sprachdialoge zusammengestellt werden, um automatisiert mittels Sprache zu navigieren.

„Die Prognosen der Marktforscher und Branchenvertreter spiegeln die aktuelle Entwicklungsdynamik wider. Dabei zeichnen sich drei Trends ab, die getrennt zu betrachten sind. Erstens ist die Endgeräte-Bedienung per Sprachbefehl im Auto stark im Kommen und wird die Akzeptanz von Spracherkennung in vielen anderen Anwendungsgebieten positiv beeinflussen. So bietet Navigon die Spracheingabe von Navigationszielen mit einem Satz in ihren Highend-Versionen ihrer Navigationssysteme an. Die großen Autokonzerne werden hier nachziehen“, erklärt Bernhard Steimel, Sprecher der Voice Days plus. Allerdings könne es noch zwei bis drei Jahre dauern, bis die Technik für alle Fahrzeugklassen verfügbar ist. „Zweitens gibt es vielversprechende Ansätze, Sprachsteuerung bei Smart Phones im Zusammenspiel mit anderen Eingabe- und Ausgabemodi einzusetzen. Ein gutes Beispiel ist die mobile Internetsuche ‚Google Mobile App’ für das iPhone. Innovationsmotor ist hier die rasant wachsende Entwickler-Community für den App Store von Apple“, so Steimel.

Als dritten Faktor sieht er die intelligente Verknüpfung von mobilen Applikationen und Sprachcomputern im Call Center-Umfeld. „Das Handy wird hier zu einem Serviceterminal, wo man ähnlich wie am Bankautomat seinen Kontostand abfragt oder eine Buchung vornimmt. Bei komplexeren Transaktionen kann jederzeit eine Telefon-Verbindung mit einem Service-Mitarbeiter aufgebaut werden; das intelligente Sprachsysteme übergibt alle Eingaben an dessen Arbeitsplatz“, erläutert Steimel. Auf den Voice Days plus in Nürnberg werden T-Mobile und Vodafone erste Prototypen im Praxisforum „Mobile Service“ am 7. Oktober vorstellen.

Dialogmanagement-System
Dialogmanagement-System
Bei der Sprachsteuerung für die mobile Internetnutzung steckt man allerdings noch in den Kinderschuhen. Das gilt vor allen Dingen für die entsprechenden Dienste der Suchmaschinenanbieter. Ein intelligentes Dialogmagement ist noch nicht möglich, um wirklich von virtuellen und persönlichen Assistenten zu sprechen: „Der Dialog-Manager agiert als zentrale Stelle im System, interpretiert jede Anfrage und leitet diese zur Verarbeitung an die übrigen Module weiter. Er entscheidet, ob und wie eine Frage gestellt wird und wie eingehende Fragen beantwortet werden. Diese auf Künstlicher Intelligenz beruhende Komponente enthält dynamische Strategien, die abhängig von der jeweiligen Situation aufgerufen werden können“, erklärt Lupo Pape, Geschäftsführer von SemanticEdge in Berlin. So könne man einen Flug nach London buchen, dann nach den Temperaturen fragen und nach Erhalt der Antwort sich wieder der Flugbuchung zuwenden. Regelbasierte und heuristische „wenn….dann“-Abfragen machten es möglich, dem Kunden auch komplexe Informationen mitzuteilen: „Für den angegebenen Preis stehen nur zwei Drucker zur Verfügung, aber für einen Aufpreis von nur 50 Euro kann ich Ihnen vier weitere Drucker anbieten, die schneller und besser sind“.

Call Center auf der Hitliste des Zorns und Sprachcomputer als Kunden-Abfangjäger

Interview mit Genesys-Manager Heinrich Welter
Interview mit Genesys-Manager Heinrich Welter
Call Center wurden in der Vergangenheit nach der industriekapitalistischen Logik auf Effizienz getrimmt nach dem Motto „One size fits all“. Eine sehr kurzsichtige Geschäftspolitik. „Eine reine Fokussierung auf Call Center als Kostensparmaschine und auf die Produktivität von Agenten reicht nicht aus. Man muss die gesamte Interaktion mit den Kunden betrachten, um optimale Services zu bieten“, sagte Heinrich Welter vom Softwarespezialisten Genesys auf der Fachkonferenz G-Force in Barcelona. Das gelte auch für die neuen Kommunikationswege des Web 2.0, die mit den tradierten Kommunikationswegen der Unternehmen harmonisiert werden müssen. Vielfach seien Telefon- und Webdienste noch voneinander getrennt.

„Insgesamt stellen wir bei vielen Firmen fest, dass sie nicht die gesamten Prozesse im Zusammenwirken mit ihren Kunden systemisch durchplanen. Bei einem großen TK-Unternehmen beschäftigt sich beispielsweise eine Geschäftseinheit nur mit dem Verschicken des DSL-Splitters, eine andere Einheit kümmert sich darum, wie ein analoger Anschluss auf DSL umgeschaltet wird, eine weitere Einheit setzt sich damit auseinander, wie man Rechnungen im Internet abwickeln kann. Ein Kundenmanagement aus einer Hand sieht anders aus. Hier setzen wir mit unseren Technologien zur Prozesssteuerung an, um Kunden systemisch bedienen zu können“, so Welter.

Hotlines würden bei Verbraucherbefragungen regelmäßig Spitzenplätze auf der Hitliste des Zorns belegen, weil sie häufig nur als notwendiges Übel betrachtet werden. „Call Center sollen so günstig wie möglich laufen, häufig auch noch ausgelagert in Billiglohnländer. Sprachautomaten verschlimmern das Ganze, wenn sie als Kunden-Abfangjäger fungieren, um Kontakte zum Call Center-Agenten zu verhindern. Hier werden keine Maßanzüge geboten. Man beschränkt sich auf Konfektionsware. Firmen verspielen nicht nur ihre Reputation, sondern handeln sich wütende Kundenanrufe ein, die unter dem Strich zu höheren Servicekosten führen. Deshalb sollte man für reibungslose und exzellente Serviceabläufe sorgen“, erklärte Welter.

Das sei aber nicht nur eine Frage der Technologie, sondern auch eine Frage der Management-Qualität. „Deswegen haben wir eine eigene Business Consulting-Gruppe gegründet. Es reicht eben nicht aus, wenn wir unseren Geschäftkunden sagen, welche Features unsere Technologien haben. Die Genesys-Berater zeigen deshalb auf, wie Prozesse systemisch einwandfrei aufgesetzt werden müssen und wie man alle Kontaktkanäle zum Endkunden ohne Medienbrüche organisiert. Das geht bis zur Aufbereitung der Rechnung, die zur mehr Klarheit im Kundenservice beitragen kann“, führte Welter weiter aus.

Thomas Wind von der Beratungsfirma TellSell Consulting sieht die Notwendigkeit eines ausgefeilten Service Designs. „Unternehmen betreiben einen großen Aufwand, um technisch brillant zu sein und möglichst viele Features zu haben. Beim Kundenservice müsste es genauso sein. Das sollte nach einem Drehbuch ablaufen aus der Sicht des Kunden. Das gilt besonders für die Sprachautomatisierung. Theoretisch sind ja viele bereit, Self Service in Anspruch zu nehmen wie am Bankautomaten oder bei der Online-Buchung von Reisen. Es muss dann allerdings auch perfekt funktionieren, was leider häufig nicht der Fall ist“, monierte Wind in Barcelona. Wenn man die Vorteile eines Services deutlich mache, der rund um die Uhr anonymisiert genutzte werden könne, steigt auch die Akzeptanz.

Generell nimmt Wind eine höhere Sensibilität in der Wirtschaft wahr, einen verlässlichen und persönlichen Kundenservice zu bieten. Sowohl für die „Generation Wählscheibe“ als auch für die „Generation Facebook“. „Auch hier werden Szenarien durchgespielt, ob jede Altersgruppe die Dienstleistungen auch wirklich versteht und richtig damit umgehen kann“, so die Einschätzung von Wind.

Oftmals würden sich die Kundenservice-Einheiten am Ende der Nahrungskette befinden und müssten sich mit Fehlleistungen im Produkt, bei Prozessen und Service herumplagen, kritisiert Bernhard Steimel, Sprecher der Voice Days plus. „Systematische Kundenforschung und lernen aus Kunden-Feedback kann helfen, bestehende Produkte zu verbessern und Service-Innovationen anzustoßen. Auf den Voice Days plus am 6. und 7. Oktober in Nürnberg wollen wir Unternehmen präsentieren, die konsequent diesen Weg gehen. Beispielsweise 02, die auf Basis von Kundenbefragungen das neue Tarifkonzept mit ‚Kosten-Airback’ entwickelt haben“, so der Ausblick von Steimel. Unter dem Motto „Service für die Facebook-Generation“ werden weitere Firmen wie eBay, Cosmos direct oder auch Audi darstellen, wie man Kunden zum Impulsgeber für Prozessoptimierung und Service-Design einsetzen könne.

Abschied vom Tastenwahlblock – Sprachsteuerung als „Tipping Point“ des mobilen Internets

Lösungen von Nuance für die Automobilbranche
Lösungen von Nuance für die Automobilbranche
Mobile Computer und Navis setzen sich nach einem Bericht des Computer Informationsdienstes (CID) immer mehr durch. Doch wer unterwegs auf den Rechner zugreifen möchte, hat nicht immer die Hände frei oder muss die Augen auf seine Umgebung richten. Hier sehen die Marktforschungsexperten der Datamonitor Group die größten Chancen für Sprachsteuerungs-Applikationen. Die weltweiten Umsätze mit sogenannter „Advanced Speech Recognition” (ASR) sollen demnach in Smartphones und mobilen Kleinrechnern von 32,7 Millionen US-Dollar im Jahr 2009 auf 99,6 Millionen US-Dollar im Jahr 2014 steigen. Für die Spracherkennung in Fahrzeugen sagen die Analysten eine Steigerung von jetzt 64,3 Millionen US-Dollar auf 208,2 Millionen US-Dollar im Jahr 2014 voraus.

Sprachsteuerung für mobile Geräte
Sprachsteuerung für mobile Geräte
Sprachcomputer zählen auch für die Suchmaschinen zu den wichtigsten Instrumenten, um das mobile Internet bequem bedienen zu können. So bietet Yahoo ab sofort die Handy-Applikation „oneSearch Voice“ für Smartphones und das iPhone in Deutschland an. Das lästige Tippen auf der kleinen Tastatur oder dem Touch-Screen falle weg. Es genüge jetzt, den Suchbegriff per einfach auszusprechen. Die Darstellung der Ergebnisse werden für Handy-Displays optimiert angezeigt: Statt langer Linklisten liefere Yahoo nach Kategorien gegliederte Antworten. Sucht man beispielsweise mit der gesprochenen Eingabe „Bundesliga“ nach aktuellen Fußballergebnissen, erhält man eine Vielzahl von detaillierten Resultaten wie aktuelle Spielstände, Tabellenübersichten, Fotos sowie weiterführende Links. Die Ergebnisse sind nach Angaben von Yahoo übersichtlich in Kategorien aufbereitet. „Das System ist lernfähig: Es passt sich immer besser an die individuelle Sprechweise seines Nutzers an, je häufiger es eingesetzt wird. Während die meisten mobilen Spracherkennungssysteme auf einzelne Kategorien wie lokale Suchen spezialisiert sind, bietet wir den Nutzern die Möglichkeit, offene Suchanfragen zu stellen – mit hoch relevanten Ergebnissen für jede Art von Spracheingabe“, erklärt Michael Stenberg, Partner Director Central & Eastern Europe Yahoo! Mobile. Stenberg. Wer es dennoch lieber klassisch mag, könne nach wie vor auch die herkömmliche Texteingabe nutzen.

tipping pointDurch das Spracherkennungs-Feature will Yahoo seine Position als zentraler Einstiegspunkt ins mobile Internet festigen. Die Applikation kann unter http://de.m.yahoo.com/voice direkt auf unterstützte Handys oder über den iTunes Store auf das iPhone heruntergeladen werden. Die Sprachsteuerung wird von Web 2.0-Pionier Tim O’Reilly http://radar.oreilly.com sogar als „Tipping Point“ gewertet: Der Begriff bezeichnet jenen Moment, in dem etwas Einzigartiges zum Normalzustand wird und einen qualitativen Umschlagspunkt markiert. „Es ist es an der Zeit, Telefone als erstklassige Geräte zu sehen, um auf das Internet zugreifen zu können, und nicht nur als Möglichkeit, Inhalte und Anwendungen umzuwidmen, die ursprünglich dazu gedacht waren, mit einer Tastatur und einem Bildschirm gelesen zu werden“, meint O’Reilly.

Tastenwahlblock auch digital bislang nicht tot zu kriegen
Tastenwahlblock auch digital nicht tot zu kriegen
Auch in der ITK-Branche erwartet man Impulse von der Sprachsteuerung: „Computer werden heute immer noch primär über eine Tastatur bedient, die aus der Schreibmaschine entstanden ist, so als ob jeder Tastendruck einen mechanischen Hebel in Bewegung setzt. Selbst der Zeilenvorschub und Wagenrücklauf alias Carriage return ist uns erhalten geblieben, obwohl damit schon lange kein Papier mehr transportiert wird. Telefone haben zwar die Revolution von der Wählscheibe hin zur – in der Regel – 3×4 Tastatur gemacht, standardisiert nach ITU E.161, das erfolgte aber bereits in den 70er Jahren. Selbst moderne Handys und Smartphones halten sich noch an den Tastenwahlblock, entweder in mechanischer Ausführung oder als Icon-Darstellung auf einem Touchscreen“, weiß Andreas Latzel, Deutschland-Chef des ITK-Spezialisten Aastra, der viel Wert auf die Benutzerfreundlichkeit seiner Systeme legt. Die Technikentwicklung verlaufe zwar rasant, im Kern aber immer noch traditionell. Vorhersehbar sei, dass der Tastaturblock an seine Grenzen stoße – spätestens mit der breiten Einführung der SIP-Telefonie und der SIP-Teilnehmeradressen.

„Anders als bei professionellen Tischgeräten kommt die Ausstattung von Handys mit alphanumerischen Tastaturen zwar auch vor, ist aber in der Regel wegen der beschränkten Abmessungen nicht befriedigend. Da bietet sich der Weg zum Sprachinterface an: der Ansage von Adressen oder Einträgen des Telefonbuchs in normaler Sprachform. Sinnvoll ist das beim Autofahren oder anderen Tätigkeiten, die beide Hände verlangen“, erläutert Latzel. Noch interessanter werde die Sprachsteuerung nach Ansicht von SemanticEdge-Geschäftsführer Lupo Pape, wenn Wissen über die Domäne und Dialogintelligenz hinzukommen. „Dann kann man von Sprachdialogsystemen sprechen. Das ist das, was wir mit dem Personal Assistant umsetzen. Dazu müssen die Wissensgebiete semantisch aufbereitet und Dialogstrategien hinterlegt werden. Die wichtigsten Use-Cases gilt es zu modellieren“, resümiert Pape.

Die elektronische Flut: Wie mit Künstlicher Intelligenz der Informationsstress bewältigt werden soll

Die E-Mail-Überflutung droht nach Ansicht von Matthias Spaetgens, Kreativ-Geschäftsführer bei Scholz & Friends, zur Arterienverkalkung moderner Organisationen zu werden: „Wir leben von den Ideen unserer Leute. Doch die Mailflut unterbricht permanent kreative Prozesse und zerstört die Kommunikationskultur“, beklagt sich der Werbefachmann nach einem Bericht der Welt am Sonntag (WamS). Ein breiter und schnell fließender Strom schwappe über Berufstätige, die ihre Arbeit an einem internetfähigen Computer versehen. „Ein Teil kommt von außen – es sind digitale Wurfsendungen, in denen für Potenzmittel, Reisen oder Glücksspiele geworben wird. Selbst wenn nur ein Prozent der Botschaften solche ‚Spammails’ sind, will der Softwarehersteller McAfee errechnet haben, entstehen einem Unternehmen mit 1000 Mitarbeitern dadurch jährlich rund 40.000 Euro Kosten“, so die WamS.

Dazu komme der tägliche kommunikative Overkill, für den es noch keine Filter gibt. Eilige Terminsachen, Sitzungsprotokolle, Rückfragen, zotige Powerpointwitze. „Der Strom versiegt nie und fordert ständige Aufmerksamkeit. Wer ihn staut, steht nach dem Urlaub vor einem ganzen See, und es fließt ständig nach“, schreibt der WamS-Redakteur Steffen Fründt. Mailserver würden auch keine Vorzimmer mehr kennen. „Früher wurde die Post von den Sekretariaten für Führungskräfte vorsortiert und nur das Wichtigste kam in die Tagesmappe. Heute beschäftigen sich die meisten Chefs höchst persönlich mit ihrem elektronischen Posteingang“, sagte Lars Thomsen vom Münchner Trendbüro „Future Matters“ beim Mehrwertforum der Deutschen Telekom in Berlin.

Informationsflut bewältigen mit Künstlicher IntelligenzDie permanente Informationsüberflutung führe zu Gefühlen von Überlastung und Fremdbestimmung. In immer mehr Jobs liege die zentrale Kompetenz in einem professionellen Medienmanagement. So wendet die Firma ItyX, Systemintegrator und Spezialist für Kundeninteraktionen, Methoden der Künstlichen Intelligenz an für die automatisierte E-Mail-Verarbeitung. Das Spezialgebiet von ItyX-Vorstand Andreas Klug ist die Computerlinguistische Forschung zur Optimierung von digitalen Geschäftsvorfällen.

„Unser System ‚Mediatrix’ kann beispielsweise im Kundenservice eingehende E-Mails analysieren und intelligent an verfügbare Servicemitarbeiter verteilen. Es senkt die Bearbeitungszeiten um 25 bis 55 Prozent“, sagte Klug bei seinem Mehrwertforum-Vortrag „Digitale Innovation trifft Künstliche Intelligenz. Es handele sich um ein lernfähiges System auf Basis dynamischer Lernmengen. „Durch den Einsatz von Mediatrix steuert das Bosch Communications Center (BCC) mandantenspezifische E-Mail-Prozesse und baut gleichzeitig essentielles Wissen auf“, ergänzte BCC-Manager Gerd Hauer, verantwortlich für den Standort Berlin. Die E-Mail-Anfragen werden automatisch kategorisiert und Expertenteams zugeordnet. Die Mitarbeiter erhalten Antwortvorschläge. Es gibt Übersichten der Kundenhistorie, Nachverfolgungs- und Eskalationsfunktionen sowie eine integrierte Wissensdatenbank.

Auf dem Mehrwertforum wurde zudem ein System vorgestellt, um die Ressourcenauslastung im Kundenservice und die Qualität der Servicebearbeitung zu verbessern. Um für die automatische Anrufverteilung ein flexibles Echtzeit-Monitoring zu realisieren, hat das Dortmunder Softwareunternehmen VoicInt Telecommunications sein „Web Enterprise Monitoring“ an die Call- Center-Plattform der Deutschen Telekom angebunden. „So stehen Kunden umfassende Informationen, Statistiken und Kennzahlen parallel zu den laufenden Prozessen bereit. Über einen beliebigen Webbrowser und sogar über Mobilfunkgeräte wie das iPhone können die Verantwortlichen beispielsweise Informationen zur Anzahl der Anrufe und Gespräche, zur Erreichbarkeit, zu Gesprächsdauer oder Service Level abrufen“, erläuterte Peter Nowack, Geschäftsführer von VoicInt.

Dialogmanager In der Optimierung der Mensch-Maschine-Schnittstelle sieht Sprachdialogexperte Lupo Pape, Geschäftsführer von SemanticEdge, den Schlüssel zur Bewältigung der Informationsflut. Intelligente Systeme sollten in der Lage sein, Vorschläge zu unterbreiten, die auf dem Verständnis und Kontext der Situation beruhen. „Die Absichten, Hintergründe und der ‚Leidensdruck‘ des Kommunikationspartners müssen antizipiert werden“, sagt Pape. Er favorisiert den virtuellen Dialog Manager: „Er ist das Gehirn des Systems: Stratege, Controller, Informationsassistent, Vertriebsmitarbeiter: Der Dialog-Manager agiert als zentrale Stelle im System, interpretiert jede Anfrage und leitet diese zur Verarbeitung an die übrigen Module weiter. Er entscheidet, ob und wie eine Frage gestellt wird und wie eingehende Fragen beantwortet werden“, erläutert Pape die Vorzüge einer intelligenten Automatisierungsstrategie.

Luhmann, semantische Technologien und die Internet-Kommunikation: Web 3.0 soll Internet-Nutzer besser verstehen

Luhmann statt Google

Das Unternehmen iQser hat ehrgeizige Ziele, die landläufig unter dem Schlagwort Web 3.0 laufen. Es setzt auf semantischen, um die Flut von Informationen durch eine automatische inhaltliche Analyse zu bewältigen. Semantische Verfahren waren lange Zeit nur ein Experimentierfeld der Wissenschaftler, berichtet die FAZ und zitiert den iQser-Chef Jörg Wurzer mit der Aussage: „Jetzt hat die Semantik die Wissenschaft verlassen. Es gibt viele Startpus, die sich damit beschäftigen“. Und damit sei nicht nur das Großprojekt Theseus gemeint, das vor allem von großen Unternehmen getragen wird. „Unternehmen stehen vor der Herausforderung, eine Fülle von Informationen zu verarbeiten, die von Jahr zu Jahr wächst. Die hohe Verfügbarkeit von Informationen im Internet und immer mehr Anwender sowie Organisationen, die an der Produktion von Informationen beteiligt sind, tragen zu diesem Prozess bei“, teilt iQser in einer Presseerklärung mit.

Mit einer Software wolle man alle wichtigen internen und externen Informationen automatisch vernetzen. Jedes Dokument, jede E-Mail und jede Nachricht werde Projekten, Aufgaben oder Personen zugeordnet. Man solle nicht mehr nach Informationen suchen, sondern ihren Kontext auswählen und automatisch alle Informationen geliefert bekommen, die zu diesem Kontext gehört. Das könnten neue Forschungsberichte oder aktuellen Nachrichten sein.

So könnten Reiseziele auf Portalen wie Triptivity mit passenden Nutzerkommentaren aus sozialen Netzwerken oder mit Reisebeschreibungen angereichert werden. „Ein zweites Analyse-Ergebnis gibt einen Überblick darüber, welche Themen in den Artikeln behandelt werden, in welche Aspekte sie sich auffächern und welche grundlegenden Fakten vermittelt werden. Das dafür automatisch ermittelte Begriffsnetz wird in Form eine Baumes dargestellt, den der Anwender nutzen kann, um sein Interesse einzugrenzen und eine entsprechende Artikelauswahl vorzunehmen“, so iQser.

Mitarbeiter würden einen Überblick über die verfügbaren unstrukturierten Informationen erhalten, ohne diese zuerst sichten zu müssen. Anschließend sei eine Auswahl nach Interessenschwerpunkten möglich. Mit einem Web-Monitoring könne man erkennen, in welchem Zusammenhang im Internet über ein Unternehmen und seine Produkte diskutiert wird.

Experten für Künstliche Intelligenz sind sich einig, dass bei den neuen Projekten des semantischen Webs die Sprache eine ganz entscheidende Rolle spielen muss. „Beim Web 3.0 versucht man die Ergebnisse der Sprachforschung zu nutzen, um Suchbegriffe oder natürlich-sprachliche Suchanfragen tiefer zu analysieren und semantisch anzureichern. Suchergebnissen sollen am Ende präziser, besser strukturiert und um viele andere, nahe liegende Themengebiete angereichert werden. Idealerweise kann eine gestellte Frage dann auch in einem Satz beantwortet werden“, so die Erkenntnis des Sprachdialogexperten Lupo Pape, Geschäftsführer von SemanticEdge in Berlin.

Diesem Trend entgegen komme die immer stärkere semantische Aufbereitung der Webinhalte in vielen Suchbereichen durch Internetnutzer, auch „Prosumer“ genannt, die in weltweiten Netzwerke aktiv sind. Das beste Beispiel hierfür sei Wikipedia. „Bisher musste das Wissen weitestgehend manuell in sogenannten Ontologien oder Taxonomien erstellt werden, welche die Begriffe zu einander in Beziehung setzen und daraus Wissensrepräsentationen unterschiedlichster Domänen bilden. Firmen wir iQser versuchen nun, das Wissen im Intranet oder Internet automatisch aufzubereiten. Das Ergebnis sollte eine Antwort und keine ewig lange Ergebnisliste mit vielen irrelevanten Texten sein“, erläutert Pape.

Gekoppelt mit Spracherkennung und Sprachsynthese könne dieser Weg zu ganz neuen Sucherfahrungen führen. Eine gesprochene Frage zu einem beliebigen Thema werde dann auch mit einem gesprochenen Satz beantwortet. „Dieses Szenario ist keinesfalls Science-Fiction, denn parallel zu den Fortschritten in der Suchtechnologie macht auch die Spracherkennung enorme Fortschritte. Auch die Dialogtechnologie spielt hier ein bedeutende Rolle, da bei vielen Anfragen weiterführende Fragen und Präzisierungen erforderlich sind“, sagt Pape. Die Frage „Wie komme ich jetzt am schnellsten nach Berlin?“ macht die Klärung erforderlich, ob man mit Zug, Auto oder Flugzeug reisen möchte. Es werde nach Ansicht des SemanticEdge-Chefs noch lange dauern, bis die vielen Informationen semantisch erschlossen und die wichtigsten Nutzungsszenarien klar sind. Bei Fahrplaninformationen, Navigation oder Adressdaten sei jetzt schon vieles möglich. Frei nach dem Soziologen Niklas Luhmann muss das semantische Web drei Komponenten der Kommunikation erfüllen: Mitteilung, Information und Verstehen.

Spracherkennung als Bürokratiekiller im Gesundheitswesen

Sie produzieren Berge von Bürokratie – so lautet einer der häufigsten Kritikpunkte an modernen Gesundheitssystemen in aller Welt. „Doch gegen Bürokratie lässt sich etwas unternehmen: Kliniken, die bei der Erstellung von Dokumenten auf digitales Diktat und Spracherkennung setzen, beschleunigen damit das Anfertigen von Arztbriefen und Befunden“, berichtet der Fachdienst HealthTech Wire.

Sie würden das medizinische Personal entlasten, die Patientensicherheit erhöhen und die einrichtungsübergreifende Vernetzung voranbringen. „Aktuelle Daten dazu liefert zum Beispiel Javier Quiles del Rio, IT-Leiter des Gesundheitsdienstes in der spanischen Region Galizien. Dort werden derzeit alle 14 öffentlichen Krankenhäuser mit Spracherkennung ausgestattet“, so HealthTech Wire. „In einem Krankenhaus mit 1.200 Betten hat sich durch die Spracherkennung die Zeit bis zur Erstellung eines endgültigen radiologischen Befundes von knapp zwei Tagen auf einen halben Tag reduziert“, erläutert Quiles del Rio.

Die Vorteile einer automatisierten Dokumentation bestätigt der Radiologe Dr. Robert Kierse vom Institut für Röntgendiagnostik und Nuklearmedizin am Klinikum Neuperlach: „Der ganze Prozess der Dokumentenerstellung mit Diktat auf Band, Transkription im Schreibbüro oder Korrektur konnte von sieben Schritten auf nur drei Schritte reduziert werden“, so Kierse gegenüber dem CIO-Magazin. Auf diese Weise werden nicht nur Kosten gespart, der Patient könne durch die beschleunigte Erstellung des Befundes auch schneller behandelt werden. Mittlerweile werden in Neuperlach 90 Prozent aller radiologischen Dokumente mit Online-Spracherkennung erstellt, die übrigen zehn Prozent mit Offline-Spracherkennung.

Das intelligente Heim - Projekte des Bundesfamilienministeirums
Das intelligente Heim - Projekte des Bundesfamilienministeriums
Auch das Pflegeheim „Im Münchfeld“ des Arbeiter Samariter Bundes (ASB) in Mainz sammelte positive Erfahrungen in einem Pilotprojekt. Über eine intelligente Vernetzung von Hard- und Software sollen die Pflegeprozesse optimiert werden. Das umfasst die Software OPAS Sozial und moderne Spracherkennungstechnologien. Die technische Basis der in diesem Pilotprojekt entwickelten Lösung, die mittels Telefon und Sprache eine strukturierte und zugleich individuelle Dokumentation der Pflege ermöglicht, bildet eine modulare, integrierte Informations- und Telekommunikations-Plattform von Aastra-DeTeWe. Sie umfasst einen Kommunikations-Server sowie die neuesten Versionen der Kommunikationslösungen für stationäre Pflege und Betreutes Wohnen: Aastra Voice Portal für die Spracherkennung und die OPAS Sozial Software-Lösung für die stationäre Pflege.

Die Dokumentation mittels Spracherkennung erfolgt häufig im Bewohnerzimmer oder direkt im Anschluss an die Pflegeleistung. Der Anteil des Pflegepersonals, der so vorgeht, ist deutlich gestiegen. So geben knapp 90 Prozent zu Protokoll, dass die Lösung leicht bedienbar sei und rund 80 Prozent der Umfrageteilnehmer ziehen die EDV-gestützte Pflegedokumentation mit OPAS Sozial einer Papierbasierten Dokumentation vor.

Zusätzlich hierzu wurde in einem Überwachungsaudit der Einrichtung im Münchfeld von 2008 zur Zertifizierung nach DIN ISO 9001:2000 von den Auditoren festgehalten, dass die im Rahmen des Modellprojekts modifzierte Pflegedokumentation einen nachvollziehbaren Fortschritt im Hinblick auf Vereinfachung, Zeitersparnis und Erhöhrung der Zuverlässigkeit in der Dokumentation darstellt. Die digitale Sprachverarbeitung und insbesondere die Spracherkennung könnten auch dazu beitragen, Kliniken den Umstieg von der Papierdokumentation auf elektronische Patientenakten zu erleichtern.

„Im Zusammenhang mit elektronischen Patientenakten ist Spracherkennung für mich ein strategisches Werkzeug. Spracherkennung hilft uns dabei, die Digitalisierung umzusetzen, weil es ein schnelles und einfaches Verfahren ist, elektronische Dokumente zu erstellen“, betont Quiles del Rio. Auch hier hat er Zahlen aus Spanien parat: In radiologischen Abteilungen mit Spracherkennung liegt die Quote der Befunde, die elektronisch verfügbar gemacht werden, bei mehr als 90 Prozent. Einrichtungen ohne Spracherkennung kommen nur auf die Hälfte.