Virtuelles Fräulein vom Amt – Sprachgesteuerte Handys als Tipping Point des Internets

Die Sprachsteuerung des iPhones mit „Google Mobile App“ http://googlemobile.blogspot.com wird von Web 2.0-Pionier Tim O’Reilly als „Tipping Point“ gewertet: Der Begriff  bezeichnet jenen Moment, in dem etwas Einzigartiges zum Normalzustand wird und einen qualitativen Umschlagspunkt markiert. „Es ist es an der Zeit, Telefone als erstklassige Geräte zu sehen, um auf das Internet zugreifen zu können, und nicht nur als Möglichkeit, Inhalte und Anwendungen umzuwidmen, die ursprünglich dazu gedacht waren, mit einer Tastatur und einem Bildschirm gelesen zu werden“, schreibt O’Reilly in seinem Blog http://radar.oreilly.com. Mit der Sprachsteuerungsfunktion werde ein neuer Weg für Computerdienstleistungen beschritten. „Apple begeisterte uns mit dem iPhone-Touchscreen, aber die Einbeziehung des Beschleunigungsmessers war fast ebenso wichtig; und jetzt hat Google uns gezeigt, wie dieser als Hauptkomponente einer Benutzeroberflächenanwendung eingesetzt werden kann. Legen Sie das Telefon ans Ohr und die Anwendung fängt an mitzuhören; eher durch eine natürliche Geste als durch ein künstliches Klopfen oder Klicken ausgelöst. Ja, der Beschleunigungsmesser wurde bereits in Spielen wie tilt oder the iPint verwendet, aber Google hat das Ganze noch etwas weiter getrieben durch die Integration des Telefon-Hauptsensors: das Mikrofon“, so O’Reilly. Nach seiner Ansicht liegt hier die Zukunft von Mobiltelefonen: eine Benutzeroberfläche zu entwickeln, die alle bisherigen Generationen über Bord wirft. Zeigen und klicken war ein Durchbruch für Computer, aber eine Sackgasse für das Design von Benutzeroberflächen.  

Mittlerweile haben das iPhone und ähnliche Smartphones eine Vielzahl an Sensoren: Mikrofon, Kamera, Touchscreen, Beschleunigungsmesser, und Standortortung. Neue Anwendungen und Kombinationen werden zu weiteren Überraschungen führen. „Künftige Geräte werden eine immer größere Anzahl an Sinnen haben, um darauf zu achten, was wir wollen. Könnte ein Telefon die Bewegung erkennen, die wir machen, wenn wir eine Kamera vor uns hochhalten, damit wir die Einstellungen festlegen können? Könnten wir mit dem Telefon reden um Kameraeinstellungen zu verändern? Könnte ein Telefon automatisch die Bewegung eines Autos erkennen und auf Sprachwahl umstellen? Und dann gibt es natürlich noch alle weitere Interaktionen mit anderen Geräten die möglich sind, wenn wir das Telefon als Steuerteil betrachten – ähnlich der Wii-Konsole von Nintendo“, erklärt O’Reilly. 

Auch in der ITK-Branche erwartet man Impulse über die Sprachsteuerung: „Computer werden heute immer noch primär über eine Tastatur bedient, die aus der Schreibmaschine entstanden ist, so als ob jeder Tastendruck einen mechanischen Hebel in Bewegung setzt. Selbst der Zeilenvorschub und Wagenrücklauf alias Carriage return ist uns erhalten geblieben, obwohl damit schon lange kein Papier mehr transportiert wird. Telefone haben zwar die Revolution von der Wählscheibe hin zur – in der Regel – 3×4 Tastatur gemacht, standardisiert nach ITU E.161, das erfolgte aber bereits in den 70er Jahren. Selbst moderne Handys und Smartphones halten sich noch an den Tastenwahlblock, entweder in mechanischer Ausführung oder als Icon-Darstellung auf einem Touchscreen“, weiß Andreas Latzel, Deutschland-Chef des ITK-Spezialisten Aastra http://www.aastra.de, der viel Wert auf die Benutzerfreundlichkeit seiner Systeme legt. Die Technikentwicklung sei zwar rasant schnell und ein gutes User-Interface inzwischen intelligent sowie kontextbezogen – im Kern aber immer noch traditionell. Vorhersehbar sei, dass der Tastaturblock an seine Grenzen stoße – spätestens mit der breiten Einführung der SIP-Telefonie und der SIP-Teilnehmeradressen.

„Anders als bei professionellen Tischgeräten kommt die Ausstattung von Handys mit alphanumerischen Tastaturen zwar auch vor, ist aber in der Regel wegen der beschränkten Abmessungen nicht befriedigend. Da bietet sich der Weg zum Sprachinterface an: der Ansage von Adressen oder Einträgen des Telefonbuchs in normaler Sprachform. Sinnvoll ist das beim Autofahren oder anderen Tätigkeiten, die beide Hände verlangen. Ein gutes Beispiel im professionellen Umfeld ist die Pflege in Altenheimen mit der Aastra-Branchenlösung OPAS. Hier kann beispielsweise mittels Telefon und Sprache die erbrachte Leistung dokumentiert werden – das Pflegepersonal gewinnt viel mehr Zeit für die Bewohner“, sagt Latzel. Übrigens schlage die Technik mit der Sprachwahl den Bogen zurück zu den Anfängen des Telefons vor der Einführung des Selbstwählsystems: damals aktivierte man den Telefonapparat durch Erzeugung einer Rufspannung über den Kurbelinduktor und sagte dem „Fräulein vom Amt“, mit welchem Teilnehmer man sprechen möchte. „Im modernen Telefon mit Sprachinteraktion wird das Fräulein von einer Software ersetzt“, so Latzel. In Kombination mit den Datenwolken von Google ergeben sich nach Prognosen von O’Reilly ungeahnte Möglichkeiten. „Sensorenreiche Geräte mit Anwendungen, die diese Sensoren nutzen, um mit Datenwolkendiensten zu interagieren und sie zu füttern. Der Standortsensor weiß, wo man sich befindet; das Mikrofon erkennt den Klang der Stimme, so dass es persönliche Daten in der Datenwolke frei setzt; die Kamera nimmt Objekte und Personen auf und sendet ein Bild zu einer abgelegenen Anwendung, die diese erkennt und die entsprechenden Informationen abruft“, führt O’Reilly aus. Viele Durchbrüche würden bereits vor der Tür stehen. Die Stimmen- und Gestenerkennung in der Google Mobile-Anwendung seien nur der Anfang. Der gleichen Meinung ist der Berliner Sprachdialogexperte Lupo Pape: „Es ist erst einmal eine Sprach- oder Diktiererkennung, die auf einer Suchmaschine und demnächst sogar auf weiteren Handyfunktionen aufsetzt. Sprachdialogsysteme werden es erst, wenn ein Wissen über die Domäne und Dialogintelligenz hinzukommen. Das ist das, was wir mit dem Personal Assistant umsetzen. Dazu müssen die Wissensgebiete semantisch aufbereitet und Dialogstrategien hinterlegt werden. Die wichtigsten Use-Cases gilt es zu modellieren“, resümiert SemanticEdge-Geschäftsführer Pape.

 

Siehe auch:

http://de.youtube.com/watch?v=y3z7Tw1K17A&eurl=http://googlemobile.blogspot.com/

http://googleblog.blogspot.com/2008/11/now-you-can-speak-to-google-mobile-app.html

 

Mit Spracherkennung Politikern auf den Zahn fühlen – Neue Google-Suchfunktion „Elections Video Search“ soll amerikanischen Wahlkampf transparenter machen

Wer kennt das nicht: Gerade zu Wahlkampfzeiten verlieren sich Politiker in ihren Reden oftmals in Floskeln, Endlosschleifen und rhetorischen Leerformeln – die wichtigen Informationen werden darunter verschüttet.. Um dem zu entgehen, bietet Google eine neue Suchfunktion an. Google Elections Video Search wandelt die Reden der Politiker in Texte um und synchronisiert sie mit den Videos auf YouTube. Der Zuschauer muss sich nicht mühevoll die langatmigen Reden ansehen, sondern kann den Politikern gezielt auf den Zahn fühlen, indem er über Suchbegriffe die Rede eingrenzt. Die gewünschten Teilbereiche werden gelb markiert, vorspulen wird somit kinderleicht. Parallel zum gesprochenen Wort werden zudem die Texte eingeblendet.

 

Möglich wird diese Suchfunktion durch die so genannte Speech-to-Text-Technologie. Dafür wandelt ein Algorithmus jedes gesprochene Wort in Text um. Eine bislang nicht fehlerfreie Anwendung, wie die Google-Produktmanager Arnaud Sahuguet und Ari Bezman im Unternehmensblog http://googleblog.blogspot.com/2008/07/in-their-own-words-political-videos.html bestätigen: „Spracherkennung ist ein schwieriges Problem, das noch nicht vollständig gelöst ist. Wir arbeiten jedoch ständig daran, die Genauigkeit der Algorithmen und die Transkriptionsresultate zu verbessern“, führen die beiden Manager aus.

 

Bis dahin könne es vorkommen, dass einzelne Wörter oder Phrasen nicht richtig erkannt werden und Kauderwelsch auf dem Monitor erscheint. „Die menschliche Sprache ist einfach ein unglaublich komplexes System. Sobald man sie analysiert und nachzubilden versucht, offenbart sich eine Unzahl von Tücken. Allein die Koartikulation bringt Algorithmen leicht ins Schleudern. Darunter versteht man das Phänomen, dass Laute und Worte immer etwas anders ausgesprochen werden, je nachdem in welcher lautlichen Nachbarschaft sie vorkommen. Der gleiche Laut und das gleiche Wort existieren also in zahlreichen Aussprachevarianten“, erklärt Bernhard Steimel, Sprecher der Voice Days http://www.voicedays.de.

 

Bei einem geschätzten englischen Wortschatz von 600.000 bis 800.000 Wörtern, so der Duden http://www.duden.de, muss der Computer demnach mit einer fast unüberschaubar großen Menge an sprachlichem Input umgehen können. „Noch komplizierter wird es bei verschiedenen Rednern, wenn sich der Algorithmus den Eigenheiten des Sprachapparates des jeweiligen Sprechers anpassen muss“, so Steimel weiter. „Die Tage der ersten Generation der so genannten ‚Sprachcomputer’ sind glücklicherweise gezählt. Die Technologie ist inzwischen reif für Sprachdialoge, die die Erwartungen des Menschen besser verstehen. Gestützt auf eine neue Technologie-Generation entwickeln wir modulare, natürlich-sprachliche Dialogsysteme, die den Nutzer als Dialogpartner betrachten und natürlich-sprachliche Dialoge in höchster Qualität ermöglichen“, sagt Lupo Pape, Geschäftsführer von SemanticEdge in Berlin.

 

Die Produktmanager von Google wollen mit Google Elections Video Search nicht nur die Transparenz des US-Wahlkampfes erhöhen, sie erhoffen sich auch mehr Informationen darüber, wie Anwender mit Videos und eingebundenen Sprachapplikationen umgehen. „Auch wenn die transkribierten Texte noch nicht zu 100 Prozent genau sind, hoffen wir, dass die Suchfunktion für die Anwender nützlich ist“, so Sahuguet und Bezman.

Spracherkennung/Sprachcomputer: Google Maps hört aufs Wort – Automatischer Sprachdialog im Auto am attraktivsten

Besitzer eines Smartphones können den Kartendienst Google Maps ab sofort auch per Spracheingabe bedienen. In einer Testphase können zwar nur Nutzer eines Blackberry Pearl (8110, 8120 und die US-Version 8130) den neuen Service in Anspruch nehmen, Experten rechnen aber damit, dass auch andere Geräte diesen mobilen Dienst bald unterstützen. Der Anwender muss Adressen oder andere Zielorte wie Restaurants nun nicht mehr eintippen, was beispielsweise beim Autofahren die Suche erheblich vereinfacht.

Die neue Google Maps Funktion scheint konsequent, hatte der Suchmaschinengigant doch schon seit Längerem einen experimentellen Sprachservice unter dem Namen Google Voice Local Search angeboten. Unter der Nummer 1-800-GOOG-411 fragt man hierbei den Namen eines Unternehmens oder einer Unternehmensbranche in allen Teilen der USA an. Und die Möglichkeiten der Spracherkennung werden immer öfter genutzt.

Manfred Pinkal, Professor am Institut für Computerlinguistik und Phonetik an der Universität des Saarlandes, sieht vielfältige Einsatzmöglichkeiten „in allen Anwendungsfällen, in denen die Benutzung anderer Ein-Ausgabe-Wege unmöglich oder lästig ist. Dazu gehört natürlich das Feld der Telefonie-Anwendungen. Da ist die kommerzielle Umsetzung am weitesten fortgeschritten.“

Großes Potenzial macht er außerdem in allen Fällen aus, in denen Hände und Augen für eine andere Aufgabe gebraucht werden, beispielsweise bei operierenden Chirurgen, die Spiegel und Beleuchtung nachsteuern möchten. Der wirtschaftlich derzeit mit Abstand attraktivste Anwendungsfall sei der Sprachdialog im Auto: „Navigation, Telefon und Radio, mitgebrachte Elektronikgeräte – wie iPod oder Organizer – und Zugriffsmöglichkeiten auf externe Informationsdienste und Internet erlauben dem Fahrer, seine Zeit im Auto für immer reichhaltigere Infotainment-Angebote zu nutzen. Er braucht aber die Hände am Steuer und die Augen auf der Straße.“

Deshalb habe Sprache hier eine echte Chance und durchschlagende Funktion, prognostiziert der Wissenschaftler. Für den Berliner Sprachdialogexperten Lupo Pape, Geschäftsführer von Semanticedge, wird sich die Intelligenz der Sprachcomputer weiter verbessern:

„Die Sprachtechnologie ist einer der wichtigsten Technologien des 21. Jahrhunderts. In einigen Jahren werden wir unsere Bedürfnisse zu jeder Zeit einem sprachgesteuerten persönlichen Assistenten mitteilen können“, sagt Pape im Gespräch mit der Zeitschrift Direktmarketing.

Sein Unternehmen arbeitet an entsprechenden Software-Lösungen. Die virtuellen persönlichen Assistenten sollen dabei nicht nur per Spracherkennung Telefonverbindungen herstellen oder das SMS-Diktat auf dem Handy ermöglichen, sondern in Verbindung mit einem Service wie Wikipedia oder Google anspruchsvolle Fragen beantworten. Für die Spracherkennung im Auto spreche auch der Sicherheitsaspekt der „hands-free-Bedienung“, ebenso die Limitation des Armaturenbretts, deren Funktionalitäten und Anzeigen immer umfangreicher werden.

Spracherkennung ist nach einem Bericht der Süddeutschen Zeitung „in den vergangenen Jahren deshalb immer besser geworden, weil die Computer leistungsfähiger wurden. Sie können in erheblich kürzerer Zeit als früher erheblich mehr Varianten vergleichen und so die Wahrscheinlichkeit berechnen, welches Wort gemeint ist.“ Die Technik habe sich bereits „überall dort mit Erfolg ausgebreitet, wo es möglich ist, die zu erwartenden Muster einzuschränken, beispielsweise beim Auskunftssystem der Bahn – oder in Krankenhäusern. Radiologen hatten dort das Problem, dass sie gleichzeitig Texte eingeben und auf Röntgenbildern herumdeuten sollten.“

Kunden wollen keinen Service, sondern selbsterklärende und zuverlässige Produkte

Der beste Service ist kein Service. Bill Price, der frühere Kundenservice-Manager des Online-Buchhändlers Amazon, hat diese provokante These formuliert:

„Der durchschnittliche Kunde hat einfach keine Lust, seine Bank anzurufen oder seinem Online-Händler eine E-Mail zu schicken, wenn eine von ihm in Anspruch genommene Sachleistung weiterer Erklärungen bedarf oder Defizite aufweist. Stattdessen sollte alles von Anfang an klar strukturiert und problemlos verlaufen“, so seine Analyse der Servicewünsche auf Kundenseite.

Mit dem Kauf eines Produktes soll der Kunde zufrieden sein und gar keinen Anlass finden, wieder mit dem Unternehmen in Kontakt zu treten, bestenfalls für weitere Käufe. Bei Amazon ist daher die Zahl der Kontakte pro Kundenauftrag längst eine wichtige Steuerungsgröße.

Hat der Kunde dennoch einen Grund, sich beim Unternehmen zu melden, sei es wichtig, intelligente Selbstbedienungs-Konzepte zu entwickeln, so Price in seinem gemeinsam mit David Jaffe verfassten Buch „The best service is no service“.

„Die These von Bill Price ist verlockend und einleuchtend zugleich: Kunden wollen keinen Service, sondern selbsterklärende und zuverlässige Produkte, die möglichst den Servicefall ausschließen bzw. mit schnell und einfach zu bedienenden Self Service- Angeboten kombiniert sind“, bewertet Bernhard Steimel, Sprecher der Initiative Voice Business (IVB), die Empfehlungen des ehemaligen McKinsey-Beraters Price gegenüber dem Onlinemagazin NeueNachricht.

Die Praxis zeigt, dass es vielen Unternehmen nicht gelingt, diesen Maßstäben gerecht zu werden.

„Sie schlagen sich anscheinend lieber in ihre Kundendienst-Abteilungen mit den Auswirkungen und Symptomen schlecht konzipierter Produkte und Services herum und betätigen sich in der Brandbekämpfung, ohne die Ursachen wirklich zu beheben“, weiß Steimel, der vor allem die Servicekultur im hart umkämpften Telefonmarkt kritisch unter die Lupe nimmt. „Insbesondere bei den Festnetzanbietern bekommt man zuweilen den Eindruck, dass sie alles tun, um möglichst viele Servicevorfälle zu generieren.“

Schlechte Erreichbarkeit, unzureichend geschultes Hotline-Personal, Tarifdschungel und abmahnfähige Geschäftsbedingungen führt er als Beispiele für schlechte Serviceerlebnisse an.

„All das führt schnell zu Kundenfrust. Mitarbeiter sind oftmals nicht in der Lage ein Problem am Telefon zu lösen, da sie lediglich für einfache Auskünfte, die so genannten FAQs, geschult sind, und über keine oder geringe Vollmachten verfügen, um ein Kundenanliegen schnell und unbürokratisch zu lösen,“ berichtet Steimel.

Kann einem Kunden nicht geholfen werden, werde dieser versuchen, über andere Kanäle das Unternehmen zu erreichen.

„Diese Mehrfach-Kontakte, der von Price zitierte ‚Schneeballeffekt’, werden dann zum echten Problem, wenn Anfragen über unterschiedliche Eingangskanäle nicht einem Vorgang zugeordnet werden können. Diese Fähigkeit besitzen leider die wenigsten Unternehmen. Zudem gibt es oftmals keine adäquate Möglichkeit einfache Vorgänge schnell selbst zu erledigen. Wer es gewohnt ist, seine Flüge online zubuchen, den telefonischen Quick Check-In bevorzugt und Sitzplatzreservieren per SMS liebt, der hat wenig Spaß bei den meisten Angeboten der Telefonfirmen zur Selbstadministration per Telefon oder im Internet“, so Steimel.

Telekommunikationsunternehmen müssten sich Gedanken machen, wie sie ihre Service-Intelligenz verbessern. Dazu zähle auch die Entkomplizierung von Produkten. Zudem müssten die Telefonfirmen ihre Service-Units als Profit- und nicht als Costcenter betrachten. Seine Prognose:

„Es spricht einiges dafür, dass ähnlich wie bei den Fluggesellschaften gut gemachte Self-Service Angebote auch angenommen werden, die Anzahl der Kundenanfragen sinkt und damit die Kunden-Zufriedenheit steigt.“

Positive Beispiele sind für ihn automatisierte Erinnerungsanrufe und aktive Informationen bei Serviceausfällen wie bei der Telekom Austria oder Sprachportallösungen wie sie T-Mobile nutzt, bei denen einfache Transaktion am Telefon schnell und ohne Warteschleife erledigt werden können.

„Die Exzellenz im klassischen Kundenservice und beim Servicedesign muss in den nächsten Jahren deutlich verbessert werden, sonst werden viele Jobs über die Klinge springen“, prognostiziert Steimel.

Der Fachmann für automatische Spracherkennung hält Unternehmen für zukunftsfähig, die komplexe Technik möglichst simpel nutzbar machen, das Plug-and-Play-Prinzip beherrschen, auf Produktästhetik achten und im Kundenservice auf persönliche und individuelle Wünsche eingehen.

„Alles andere läuft über Maschinen besser. Es dauert nicht mehr lange, dann können Automaten auf die Stimmungslage des Benutzers reagieren, einen Griesgram mit Humor freundlich stimmen, den Gestressten zügig bedienen und den Ratsuchenden mit ausführlichen und genauen Informationen versorgen – muffelnde Call Center-Agenten, dümmliche Beratung von der Stange, bürokratische Organisationen, überflutete Wartezimmer beim Onkel Doktor, Terminschlampereien von Kfz-Betrieben, Warteschleifen am Telefon oder genervtes Verkaufspersonal kann sich niemand mehr leisten“, warnt Steimel.

„Wir müssen die Self Service-Intelligenz viel stärker im Kundenservice verankern – vor allen Dingen im Call Center“, bestätigt Lupo Pape, Geschäftsführer von SemanticEdge in Berlin. Ein Automatisiertes System müsse fähig sein, eine Kommunikation einfach und über viele Kanäle führen zu können. Es sollte Vorschläge unterbreiten, die auf dem Verständnis und Kontext der Situation beruhen. „Die Absichten, Hintergründe und der ‚Leidensdruck’ des Kunden müssen antizipiert werden“, resümiert der Sprachdialogexperte Pape.

Das Thema Servicekultur in Deutschland beleuchtet bei den diesjährigen Voice Days am 15. Oktober in Wiesbaden auch eine Fachdiskussion, unter anderem mit Elke Wieczorek (Vizepräsidentin des Deutschen Hausfrauenbundes), Dr. Andreas Albath (Vorstandschef der telegate AG), Gülabatin Sun (Managing Direktor HVB Direkt GmbH), Gerald Schreiber (Geschäftsführender Gesellschafter der defacto.gruppe) und Renatus Zilles (Vorsitzender der Geschäftsführung des Mehrwertdienste-Anbieters Next ID).

Warum der beste Service kein Service ist: Amazon und die Kampfansage an Call Center

Der ehemalige McKinsey-Berater Bill Price kam 1999 zu Amazon und revolutionierte den Kundenservice des Online-Buchhändlers. Seine radikale Philosophie: Der beste Service ist kein Service. „Der durchschnittliche Kunde hat einfach keine Lust, seine Bank anzurufen oder seinem Online-Händler eine E-Mail zu schicken, wenn eine von ihm in Anspruch genommene Sachleistung weiterer Erklärungen bedarf oder Defizite aufweist. Stattdessen sollte alles von Anfang an klar strukturiert und problemlos verlaufen“, sagt Price. Er verweist auf eine vor kurzem veröffentlichte Umfrage, die zu seinem Konzept erhellende Ergebnisse offenbart. Demnach behaupten 75 Prozent aller befragten Geschäftsführer, dass ihre Unternehmen einen überdurchschnittlich positiven Kundendienst anbieten würden. Auf der Kundenseite sieht das Bild jedoch ganz anders aus. So monierten fast 60 Prozent aller befragten Kunden, dass sie „extrem unzufrieden“ mit ihrem zuletzt erlebten Kundenservice waren.
 
„Hier liegt ganz offensichtlich eine klaffende Diskrepanz vor. Um diese Schieflage zu beseitigen, müssen wir alles daran setzen, die Kundenkontakt-Frequenz dahingehend einzuschränken, dass ineffiziente Kontakte von vornherein vermieden werden. Dafür sollten wir aktive Selbstbedienungs-Services anbieten. Und erst dann, wenn Dinge außer Kontrolle geraten, ist es unsere Aufgabe, den Kunden durch einen perfekt funktionierenden Kundenservice zu einer uneingeschränkt positiven Erfahrung zu verhelfen“, erläutert Price.
 
Bei Amazon sei schon in der Aufbauphase der Einsatz von Software zur Selbstbedienung maximiert und die gebührenfreie Telefonnummer fast unauffindbar versteckt worden. So würden sich viele der dummen Fragen von selbst erledigen, sobald man den Zustelltermin klar und deutlich anzeigt. Ebenso rechne sich der automatische Versand von E-Mails, wenn eine Bestellung eingeht, wenn sie verschickt wird oder sich verzögert. Die Zahl der Kontakte pro Kundenauftrag zählt zur wichtigsten Steuerungsgrößen bei Amazon. Man ist dem Grund für jeden Kontakt genau nachgegangen – und hat dann Vorkehrungen getroffen, diesen überflüssig zu machen.
 
So konnte der Jeff Bezos-Konzern seine Kundenkontakte in den vergangenen fünf Jahren um 90 Prozent verringern. Nach Analysen von Price sind 80 Prozent der Kundenkontakte unproduktiv. Rund 15 Prozent der Anrufer sagen: „Etwas funktioniert nicht.“ Jeder vierte Kunde äußert: „Können Sie mir erklären, wie…..“ 40 Prozent fragen: „Wo bekomme ich…? „Einige Unternehmen scheinen es einfach nicht begreifen zu wollen, wie viel Geld und Kunden-Wohlwollen sie durch ihr Verhalten aufs Spiel setzen. Und anstatt sich auf den Ausbau des optimalen Kundenservices zu konzentrieren, lassen sie sich durch ineffiziente Kontrollinstrumente und Prozesse fehlleiten. Die meisten Firmen sind unfähig, ihren Service entsprechend der Kundenbedürfnisse neu auszurichten und zu optimieren. Sie lassen alles schleifen, korrigieren reaktiv nur das Notwendigste, und zwar dann, wenn ein Problem auftritt anstatt an der Basis grundlegende Veränderungen durchzuführen. Und von diesen indifferenten ‚mir-doch-egal-Unternehmen’ gibt es so einige, vor allem dort, wo kurzfristige Rentabilitätsmotive dominieren oder wo eine techniklastige Kultur vorherrscht“, weiß Price, der mittlerweile als freier Berater tätig ist.
 
In vielen Industrien gehe es überhaupt nicht um „gute“ oder „schlechte“ Angebote. So werde es in der Finanz- oder TK-Branche eher als vorteilhaft im Sinne des Marketings oder Produkt-Designs gesehen, wenn sich Produkte oder Dienstleistungen durch hohe Komplexität auszeichnen. „Die Unternehmen glauben, dass sie dadurch bessere und hochwertigere Produkte herstellen, während eine große Anzahl der Kunden Produkte und Dienstleistungen präferiert, die einfach und unkompliziert in der Anwendung sind, wie beispielsweise iPhone von Apple oder Amazon’s 1-click“, so Price.Alaska Airlines, Amazon, CheckFree, Citibank Card, eBay, First Direct, USAA und Zappos sind nach seiner Analyse gute Beispiele für einen „verbindlichen Selbstbedienungs-Service”. Die Firma Nordstrom sei schon fast legendär für ihren Kundendienst und habe bereits zwei wichtige Prinzipien des „Best Service” etabliert: „Mache es Deinen Kunden leicht und unkompliziert, Dich zu kontaktieren“ und „Höre genau auf die Kundenanfragen und -wünsche und agiere sofort“. „Ein anderes Beispiel ist die Restaurantkette ‚The Palomino’, die Reservierungen auf ihrer Website entgegennimmt, sich verpflichtet in einer Mindestzeit Anrufe zu beantworten und somit jegliche Art von Frustration seitens der Gäste von vornherein vermeidet“, sagt Price, der im Frühjahr zusammen mit seinem Partner David Jaffe das Buch „The Best Service Is No Service“ veröffentlicht hat. Die Thesen von Price stoßen auf Zustimmung: „Wir müssen die Self Service-Intelligenz viel stärker im Kundenservice verankern – vor allen Dingen im Call Center“, fordert Lupo Pape, Geschäftsführer von SemanticEdge in Berlin. Ein Automatisiertes System müsse fähig sein, eine Kommunikation einfach und über viele Kanäle führen zu können. Es sollte Vorschläge unterbreiten, die auf dem Verständnis und Kontext der Situation beruhen. „Die Absichten, Hintergründe und der ‚Leidensdruck’ des Kunden müssen antizipiert werden“, resümiert Pape.

gray wooden computer cubicles inside room

Intelligenter Kundendialog statt Call Center-Attacken

man wearing brown suit jacket mocking on white telephone
Photo by Moose Photos on Pexels.com

Kundentreue, so eine alte Marketingbinsenwahrheit, ist die Basis für Rentabilität:

„In zahlreichen Branchen führt eine höhere Kundenbindungsrate von nur fünf Prozent zu Gewinnsteigerungen von 25 bis 100 Prozent“, weiß der amerikanische Managementexperte Frederick Reichheld.

Der entscheidende Punkt dabei sei nicht die Tatsache, dass Kunden zu gewinnen teurer ist, als bestehende Kunden zu halten, sondern dass loyale Kunden vor allem häufiger und mehr kaufen.

„Da die Kundengewinnung immer größere Anstrengungen erfordert, ist es überlebenswichtig, eine starke und treue Kundenbasis aufzubauen“, erklärt Michael-Maria Bommer bei der Vorstellung des Buches „Die Zukunft des Customer Service – Analysen, Strategien, Konzeptionen“ (Gabler Verlag).

So würden nach einer Umfrage des Softwareunternehmens Genesys 71 Prozent der Kunden bei einer positiven Call Center-Erfahrung wieder auf das Unternehmen zurückkommen, auch wenn das erworbene Produkt die Erwartungen nicht ganz erfüllt hat.

„Erfolgreiches Kundenmanagement bedeutet daher, zum Zeitpunkt der Kontaktaufnahme des Kunden oder vice versa die richtigen Dinge tun zu können und die Interaktionen intelligent zu steuern“, so Bommer.

Doch die Realität sieht nach seiner Erfahrung anders aus.

„Brav der Beziehungsthese folgend, haben Unternehmen mächtige Datenbanken aufgebaut und speichern darin Informationen über den Kunden: was er wann und wo gekauft hat, ob und wie oft er sich beklagt hat und was mit der Beschwerde passiert ist. Um einen Durchblick in diesem Datendickicht zu bekommen, stellen diese Firmen ausufernde Analysen an: Wer sind die guten Kunden, wer die schlechten Käufer. Was darauf folgt, sind teure Massen-Mailings, umfangreiche nervtötende abendliche ‚Call Center-Attacken’ sowie streuverlustbehaftete Werbemaßnahmen“, kritisiert der Service-Experte.

Das Problem dabei sei, dass die gesammelten Daten lediglich einen statischen Zustand wiedergeben, der sich in der Vergangenheit abspielte.

„Was nützt das rückwärtsgewandte Beziehungsmanagement, wenn zum Zeitpunkt des Kundenkontaktes alle vor Schreck den Füller fallen lassen, weil sie nicht wissen, was sie ihm verkaufen sollen, und nicht verstehen, wie Cross- und Up-Selling funktionieren“, sagt Bommer.

Deshalb müsse sich das gesamte Unternehmen als Servicecenter verstehen und organisatorische Brüche beseitigen. Das gelte für das Front- und Backoffice sowie für alle Zugangs- und Ausgangskanäle, ganz gleich ob Telefon, Brief, E-Mail oder Website.

„Kundendaten werden von den Firmen in Zukunft nicht nur über alle Kanäle gesammelt, sondern sie werden auch intelligent aufbereitet, um dem Kunden einen individuellen, pro-aktiven Kundenservice zu bieten und seine Kaufbereitschaft maximal auszuschöpfen. Dazu werden Kundenprofile entworfen, anhand derer die Kunden aus den bestehenden Daten automatisch ‚geclustert’ werden“, so die Vision von SemanticEdge-Geschäftsführer Lupo Pape.

Crosschannel Service ist nach Ansicht des Sprachdialogexperten Pape ein wichtiger Baustein für den Kundendialog:

„Daraus ergeben sich dann vorentworfene Dialogszenarien, die entweder beim Kontakt des Kunden vorgeschlagen werden oder die auch in Outbound-Dialogen über alle Medien abgewickelt werden. Der Berater im Call Center, der Mitarbeiter in der Filiale oder das Sprachdialogsystem werden mit einer Hypothese über das vermeintliche Anliegen des Kunden in den Dialog gehen und sie werden versuchen, dieses Anliegen persönlich und schnell zu lösen oder geschickte Vorschläge für Produkte und Services oder für die stärkere Kundenbindung einfließen zu lassen“, sagt Pape.

Mittels einer Gedächtnisfunktion könnte dabei der letzte Kundenkontakt aufgenommen und weitergeführt werden.

Der Roboter als Fitnesstrainer – Künstliche Intelligenz stellt sich auf den Menschen ein

Japan ist das Land der Automaten. „Man findet sie sprichwörtlich an jeder Straßenecke, auch in den abgelegensten Winkeln des Inselstaates. Selbst in Tempelanlagen und auf den heiligsten Berg der Japaner, den Fuji-San, sind sie vorgedrungen. Die Rede ist von den stummen, immerbereiten Verkäufern Japans, den Jido-Hanbai-ki“, schreibt Robin Loch in einer Beilage für das Fachblatt Catering Management http://www.catering.de. Dabei entwickeln sich die Automaten immer weiter. „Die berühmt-berüchtigte japanische Erfindungswut treibt die Perfektionierung dieser Spielzeuge ständig gnadenlos voran“, so der Autor. Unter anderem würden die Geräte so konzipiert, dass „Kinder, Ausländer, alte und behinderte Menschen die Geräte gleichermaßen intuitiv bedienen können.“

Doch Japans Automatenlust geht noch viel weiter: Das National Institute of Advanced Industrial Science and Technology http://www.aist.go.jp/index_en.html plant in Kooperation mit einem Roboterhersteller einen 60 Zentimeter großen humanoiden Roboter, der als Fitnesstrainer agiert. Er soll älteren Menschen verschiedene Gymnastikübungen zeigen, mit denen diese sich fit halten können. Wie Menschen und Maschinen miteinander kommunizieren, fasziniert schon seit Jahrhunderten die Forschung. Und die Geschichte der Roboter, die damit einhergeht, ist älter als man glaubt. Da war der  Trompeterautomat aus dem 19. Jahrhundert, da war Maschinen-Maria aus dem Stummfilmklassiker „Metropolis“ oder der vom Schweizer Henri Maillardet konstruierte Automat, der in der Lage war, Landschaften zu zeichnen und auf Englisch und Französisch zu schreiben.

 

Heute gehört ein Roboter nicht nur zur Grundausstattung vieler Kinderzimmer. Auch Seniorenheime machten bislang positive Erfahrungen. „In Japan wird der künstliche Heuler schon länger in der Altenpflege eingesetzt – jetzt testen auch Heime in Deutschland die Kuscheltiere als Begleiter für ihre Bewohner“, berichtet die Aachener Zeitung http://www.az-web.de über einen Streichelroboter in Robben-Outfit. „Der Unterschied zu einfachen Kuscheltieren sei die künstliche Intelligenz: Der Roboter besitze eine ausgeklügelte Software und werde erst dadurch liebenswert“, zitiert die Zeitung William Banks von der Saint Louis Universität im US-Bundesstaat Missouri. „Die Robotik ist eine Antwort auf die Probleme, die die alternde Gesellschaft mit sich bringt. Und eine Möglichkeit, sich als Exportnation auf dem Weltmarkt zu halten“, beschreibt die Financial Times Deutschland http://www.ftd.de die Verbreitung der Roboter auch auf dem Gesundheitsmarkt.

 

Die Maschinen kommen dem Menschen dabei immer näher und stellen sich auf ihn ein. Das beweist auch die Entwicklung der Sprachtechnik. „Das hat mit mechanischen Mitteln im 18. Jahrhundert schon der Hofrat Wolfgang Baron von Kempelen am Hofe von Kaiserin Maria Theresia unter Beweis gestellt. Die Sprechmaschine von Kempelen folgte den Ideen der Aufklärung und sollte Gehörlosen eine vernehmbare Stimme verleihen. Dabei war Kempelen, wie später Charles Wheatstone oder Alexander Bell, davon überzeugt, dass sich die Konstruktion sprechender Maschinen am Vorbild des menschlichen Artikulationsapparats zu orientieren hätte. Dieser Forschungsansatz hat sich auch heute nicht wesentlich geändert. Softgesteuerte Sprachdialogsysteme müssen intelligenter werden, damit sie besser verstehen, was der Mensch von ihnen will“, resümiert Lupo Pape, Geschäftsführer von SemanticEdge http://www.semanticedge.de.

„Jedes Mal, wenn ein Kunde online geht, wächst sein Service-Anspruch beim Kiosk an der Ecke“

Obwohl die Softwaretechnologie heute alles automatisiert und Routineprozesse abwickelt, sind nach Ansicht des amerikanischen Marketingexperten Don Peppers die meisten Call Center noch zu wenig mit entsprechenden Lösungen ausgestattet – sie sind „unter-automatisiert“:

„Das ist schlecht. Wenn die verfügbare Software aber irgendwann zum Einsatz kommt, passiert Folgendes: Immer mehr Aufgaben und Prozesse, die sich automatisieren lassen, werden online abgewickelt, sie wandern ins Internet. Warum sollte ein Kunde darauf warten, mit jemandem sprechen zu dürfen, wenn er sich auf einer Internet-Seite selber helfen kann? Heute nutzt auch jeder den Geldautomaten und niemand geht mehr an den Geldausgabeschalter zum Bankangestellten. Call Center werden in Zukunft also zunehmend gebraucht, um Ausnahmefälle zu klären, also solche Dinge, die sich im Vorfeld nicht automatisieren lassen, oder Anfragen, die durch das normale Raster fallen“, sagt Peppers im Interview mit der Fachzeitschrift isreport.

Bei den Call Center-Agenten sei deshalb ein gesundes Maß an Urteilsvermögen und Kreativität vonnöten. Man brauche motivierte und entschlussfreudige Mitarbeiter.

„Die Softwaretechnologie kann dabei nur unterstützen. Zukünftig wird es im Call Center weniger Mitarbeiter geben, von denen jeder einzelne aber wichtiger wird“, so der Autor des Buches „Rules to break and laws to follow“ (VCH Wiley-Verlag).

Der steigende Anteil der Automatisierung und die immer intelligenter werdenden Self Service-Angebote werden sich nach Ansicht von Peppers auf die gesamte Wirtschaft auswirken:

„Jedes Mal, wenn ein Kunde online geht und großartigen Kundenservice von Amazon, eBay oder Google bekommt, wächst auch sein Service-Anspruch beim Kiosk an der Ecke.“

Ein Kunde ertrage keinen Verkäufer mehr, der nicht weiß, wo die Ware liegt oder der nicht in seiner Pause gestört werden will.

„Die Exzellenz im klassischen Kundenservice und beim Servicedesign muss in den nächsten Jahren deutlich verbessert werden, sonst werden viele Jobs über die Klinge springen“, prognostiziert Bernhard Steimel, Sprecher der Voice Days.

Der Fachmann für automatische Spracherkennung hält Unternehmen für zukunftsfähig, die komplexe Technik möglichst simpel nutzbar machen, das Plug-and-Play-Prinzip beherrschen, auf Produktästhetik achten und im Kundenservice auf persönliche und individuelle Wünsche eingehen.

„Alles andere läuft über Maschinen besser. Es dauert nicht mehr lange, dann können Automaten auf die Stimmungslage des Benutzers reagieren, einen Griesgram mit Humor freundlich stimmen, den Gestressten zügig bedienen und den Ratsuchenden mit ausführlichen und genauen Informationen versorgen – muffelnde Call Center-Agenten, dümmliche Beratung von der Stange, bürokratische Organisationen, überflutete Wartezimmer beim Onkel Doktor, Terminschlampereien von Kfz-Betrieben, Warteschleifen am Telefon oder genervtes Verkaufspersonal kann sich niemand mehr leisten“, warnt Steimel.

Der Kölner Wissenschaftler Bernd Vorwinkel geht in seinen Analysen sogar noch weiter. Er sieht die künstliche Intelligenz im Alltag und Arbeitsleben unaufhaltsam auf dem Vormarsch.

„Da die künstliche Intelligenz noch nicht über ein eigenes Bewusstsein verfügt, ist sie der menschlichen Arbeitskraft besonders dort überlegen, wo die Tätigkeit auf die Abarbeitung festgelegter Abläufe zurückgeführt werden kann. Damit sind die Bereiche betroffen, in denen keine große Kreativität gefordert wird“, schreibt er in seinem Opus „Maschinen mit Bewusstsein – Wohin führt die künstliche Intelligenz“.

So seien praktisch alle Berufe im Bankenwesen und in der Industrieproduktion im Prinzip schon jetzt durch künstliche Intelligenz ersetzbar. „Selbst bei so anspruchsvollen Tätigkeiten wie der Verwaltung von Aktienfonds haben Computerprogramme in der Regel größeren Erfolg als Menschen…Die Massenproduktion in der Industrie wird schon in naher Zukunft ausschließlich von Computern und Robotern ausgeführt werden können. Auch in der Landwirtschaft werden computergesteuerte Maschinen die Bearbeitung der Nutzflächen bis hin zur Ernte übernehmen“, so die Vorausschau von Vorwinkel. Ähnlich sieht es Steimel:

„Früher brauchte man die Produktion nur auf Masse trimmen, um die Produktivität zu erhöhen. Im Zeitalter der Dienstleistungsökonomie funktioniert das nicht mehr. 70 Prozent der Führungskräfte im öffentlichen Dienst und in der Wirtschaft verbringen ihre Arbeitszeit mit dem Rücken zum Kunden. Das müssen wir umkehren. Heute liegt die Aufgabe darin, im Kundenservice klüger zu arbeiten und sich vom alten Denken des industriekapitalistischen Zeitalters der Massenproduktion zu verabschieden“, fordert Steimel.

Produktivitätssteigerungen könne man bei Dienstleistungen nur über eine Bildungs- und Wissensoffensive erreichen. Wer diese Transformation am besten und schnellsten bewältige, werde das 21. Jahrhundert wirtschaftlich dominieren.

„Das haben viele in unserem Land immer noch nicht begriffen. Erst vor sieben Monaten bescheinigte die OECD dem deutschen Bildungssystem dramatische Mängel. Deutschland war unter 30 Industrienationen abgerutscht von Platz 10 auf Platz 22, viel zu wenig junge Leute studierten. Die heute 45- bis 64-Jährigen weisen bessere Bildungsabschlüsse auf als die 25- bis 34-Jährigen. Der Bildungsstand der Bevölkerung wird in den nächsten Jahrzehnten zum wichtigsten Faktor für Wohlstand und Wirtschaftswachstum“, resümiert Steimel.

Die Autoren Stefan Bonner und Anne Weiss beschreiben den Bildungsabstieg in ihrem Buch „Generation Doof“ noch drastischer. In der jungen Generation gebe es immer mehr geistige Totalschäden: „Grazile Models, deren Gehirn anscheinend so schlank ist wie ihr Körper, und Schüler, die hart auf eine Hartz IV-Karriere hinarbeiten, sind nur die Ausläufer einer großen Intelligenzschmelze. Die Dummheit geht um in Deutschland.“

Unternehmensberater Jarvis hält Microsoft-Yahoo-Zusammenschluss nicht für sinnvoll: Entscheidungsschlacht um Hoheit des mobilen Internets – Das Handy als Antwortmaschine

Der amerikanische Unternehmensberater Jeff Jarvis http://www.buzzmachine.com hält einen Zusammenschluss von Microsoft und Yahoo nicht für sinnvoll. Der Gründer von „Entertainment Weekly“ erklärte im Interview mit dem Handelsblatt http://www.handelsblatt.com , dass Microsoft nur versuche, Reichweite zu kaufen. „Das ist die Sicht der Alten Medien: Sie kontrollieren Inhalten, vermarkten ihn, damit Leute herbeikommen, zeigen denen Werbung und verabschieden sie wieder“. Der Google-Weg sei besser. Man müsse seine Inhalte, seine Marke, seine Werbung exportieren und einbetten, so wie es Google mit Adsense, Youtube-Videos oder Google Maps macht. „Ich glaube, Yahoo und AOL sollten beide diesem Beispiel folgen, sie sollten alles, was sie haben, exportierbar machen und eine Plattform werden, auf der Individuen und Unternehmen Inhalte erstellen und vermischen, vielleicht sogar ein neues Geschäft starten“, empfiehlt Jarvis im Handelsblatt-Gespräch.

 

Microsoft versuche sich die Online-Strategie zu kaufen, die sie selbst nicht aufbauen konnten. Das sieht der Düsseldorfer Internet-Analyst und Voice Days-Sprecher Bernhard Steimel http://www.voicedays.de ganz anders. „Beim Übernahmekampf geht es auch um die Hoheit des mobilen Internets. Die Argumente von Jarvis konzentrieren sich zu sehr auf den Status quo des stationären Internets. Hier können Microsoft und Yahoo gegen Google keinen Blumentopf mehr gewinnen. Die Entscheidungsschlacht spielt sich auf dem Feld des mobilen Internets ab“, erwidert Steimel.

 

Und hier spiele die Technologiekompetenz bei der Sprachsteuerung eine entscheidende Rolle. „Mit dem Handy kommen Menschen ins Internet, die den Weg über den PC nie genutzt haben oder nutzen werden. Aufgrund des Formfaktors, den Screengrößen, Bedienungslimitierungen und verfügbaren Bandbreiten muss die Suche, also der primäre Zugang zu allen Inhalten und Diensten, auf dem Handy erschwerten Anforderungen gerecht werden. Sie muss sich zur Antwortmaschine weiter entwickeln, die aus der Verknüpfung von Web 2.0 und dem Semantischen Web richtige ‚Antworten’ produziert, statt lange Linklisten auszuspucken. Zudem muss die mobile Suche einfach zu bedienen sein“, weiß Steimel.

 

Wer von den Suchanbietern schließlich das Rennen gewinnen werde, hängt nach seiner Auffassung davon ab, wer den „Kampf um die besten Köpfe“ mit der größten Marktmacht verbinden kann. „Den Kampf um die Köpfe hat Google bereits gewonnen – besonders durch die Art von Google, immer alles neu zu entwickeln und die geniale Strategie, mit GOOG411 im weltgrößten ‚Freiland-Versuch’ das eigene Sprachmodell zu validieren und mit einer exzellenten Qualität aufzuwarten. Und auch bei der Marktmacht hat Google noch die Nase vorn. Auf der ersten Seite der meisten TK-Unternehmen, die ihren mobilen Kunden eine Suche anbieten, steht in der Regel die mobile Google-Suche, nicht die von Yahoo oder Microsoft Live Search“, führt Steimel aus. 

Microsoft habe sicher auch gute Leute, aber auf den Portalen der TK-Unternehmen noch keine relevante Präsenz. „Dafür kommt Microsoft aber über die Betriebssysteme ‚von unten’ in den Markt. Wenn sich der Tanker einmal in Bewegung setzt, ist er schwer zu bremsen. Gelingt es Microsoft, Windows Mobile ähnlich wie Windows XP im PC-Markt zum Quasistandard für Betriebssysteme bei Smart Phones zu machen und die Infrastrukturen mit den Communication Servern flächendeckend zu verbreiten, kann der Redmond-Konzern Google vielleicht noch kontern“, erläutert Steimel. Yahoo habe nicht so gute Karten. „Bei einem Zusammenschluss mit Microsoft würde sich das allerdings schlagartig ändern“, resümiert Steimel.

Sprachcomputer erkennen Gemütszustand – Multimodale Interfaces prägen eine neue Gerätegeneration

An Call Centern und dem Einsatz von Sprachcomputern führt für viele Unternehmen kein Weg mehr vorbei. Wettbewerbsdruck, der Zwang zur Service-Automatisierung und der Preisverfall in der Telekommunikation tragen hierzu einen großen Teil bei. Außerdem machen Wissenschaftler einen natürlichen Hang der Menschen zum Self-Service aus: Sprachverarbeitende Technologie, davon ist der Berliner Wissenschaftler Norbert Bolz http://www.medienberatung.tu-berlin.de überzeugt, werde in der Servicegesellschaft eine noch größere Rolle spielen, auch wenn der Voice Self Service dem Kunden eine andere emotionale Einstellung abverlange als im Internet, wo man genau wisse, dass man mit einem Programm in Dialog trete. „Gerade weil die Erwartungen an die menschliche Stimme so groß sind, weil man sie unmittelbar mit Gefühl, mit Menschlichkeit, mit Echtheit assoziiert, ist natürlich die Enttäuschung über ein schlechtes Programm gewaltig und ich glaube, wir alle haben schon diese Erfahrung gemacht mit schlechten Programmen“, so der Medien- und Kommunikationswissenschaftler. Lupo Pape, Geschäftsführer von SemanticEdge http://www.semanticedge.com in Berlin, erklärte im Interview mit dem Deutschlandfunk http://www.dradio.de, was moderne Spracherkennung leistet: „Die Akzente werden sehr gut abgefangen. Er kann ungefähr 50.000 bis 100.000 Worte verstehen, auch robust verstehen. Da werden Akzente abgedeckt. Natürlich, wenn ich anstelle von Kontostand sage: ‚Was ist drauf?’, dann kann es notwendig sein, dass ich das in der Grammatik hinterlegt haben muss, also dem Erkenner gesagt haben muss: ‚Was ist drauf?’ ist ein Synonym für Kontostand.“  Nach Erfahrungen von Dr. Elmar Nöth vom Lehrstuhl für Mustererkennung der Universität Erlangen-Nürnberg http://www5.informatik.uni-erlangen.de/de habe sich die Sprachdialogtechnik über die pure Spracherkennung hinaus weiter entwickelt und punkte sogar mit Emotionserkennung, die auch viele Unternehmen für den automatisierten Kundenkontakt für sich entdeckt hätten. Dabei gebe es mehrere Stufen: „Von Benutzereingaben per Tastatur über die Erkennung von Ziffern und Einzelwörtern zu der dritten Stufe, dem natürlichsprachlichen Dialog ohne feste Menüstruktur, wobei das Dialogsystem ganze Sätze versteht bis dahin, dass das Dialogsystem den emotionalen Benutzerzustand erkennt und darauf reagieren kann, um den Dialog natürlicher zu gestalten“, so Nöth. Emotionserkennung mache den Dialog mit der Maschine menschlicher, so sein Resümee. Weit fortgeschritten ist beispielsweise der multilinguale Kundenservice von T-Mobile. Er erkennt das Alter, das Geschlecht, die Sprache und die aktuelle Stimmung. Ziel dieses Projektes ist es, den Kunden mittels adaptiver Sprachdialoge individuell anzusprechen und ihn mit kundenspezifischen Angeboten zu begeistern. T-Mobile wurde für diese Lösung mit dem Voice Award der Brancheninitiative Voice Business http://www.voicedays.de ausgezeichnet.  

Natürlich-sprachliche Interfaces würden immer intelligenter, nutzerfreundlicher und bald um eine grafisches Ebene ergänzt, meint Lupo Pape. Er sieht die Sprachtechnologie nicht nur in Sachen telefonischer Kundenkontakt weiter im Aufwind. Das Stichwort heißt Multimodalität bei der Steuerung von Geräten: „Das heißt, das Voice Interface wird ergänzt durch ein grafisches Interface. Das Internet und die Sprachschnittstelle wachsen zusammen zu einem multimodalen Dialog. Und das dann auf mobilen Endgeräten, der nächsten Generation der Superhandys. Da werden wir ganz andere Arten der Mensch-Maschine-Interaktion haben. Das heißt also, man nutzt die Stärken des grafischen Interfaces mit den Stärken der Sprache. Wenn ich im Auto unterwegs bin, spreche ich. Wenn ich in der U-Bahn meine Ruhe haben will, dann nutze ich das grafische Interface. Am besten, man nutzt beide Modalitäten gleichzeitig“, so Pape im Deutschlandfunk.