Handy zum Diktat: Textnachrichten mit Spracherkennungssoftware verfassen – Nuance startet Kooperation mit Netzbetreibern

Bommer-Rede auf der Conversations in MünchenEin großes Potential für die automatische Spracherkennung sieht Nuance-Generalmanager Michael-Maria Bommer im Mobilfunk. Ich hatte dazu bereits einen Artikel für NeueNachricht geschrieben. Nach Aussagen von Bommer sind Softwarelösungen seines Unternehmens zur Handysteuerung bereits auf rund vier Milliarden Endgeräten vorinstalliert. „In diesem Jahr werden weltweit 1,1 Milliarden Handys ausgeliefert. Auf 880 Millionen Geräten ist Nuance-Technologie im Betriebssystem integriert. Insgesamt gibt es für die mobile Kommunikation zur Zeit die innovativsten und prägendsten Entwicklungen. Beispielsweise das Diktieren von SMS. Sie sprechen eine Botschaft ins Handy, die von dort an unseren Server geschickt, transkripiert und innerhalb von einer Sekunde als Text zurückgeschickt wird. Die Qualität, der Komfort und die Sicherheit, die mit diesem System etwa während der Autofahrt erzielt wird, ist enorm“, sagte Bommer auf der Fachkonferenz „Conversations“ in München. Davon sind auch andere Branchenexperten überzeugt.

„Wer Textnachrichten auf dem Handy verfassen will, muss immer noch viele Beschränkungen hinnehmen. Am Format der Endgeräte wird sich nicht viel ändern. Die Tastatur in unterschiedlichen Variationen ist für viele Menschen einfach zu klein. Sprachsteuerung wird sich hier über kurz oder lang durchsetzen, nicht nur beim Schreiben von Kurznachrichten, sondern auch bei Suchfunktionen“, prognostiziert Peter Weilmuenster, Vorstandschef des ITK-Dienstleisters Bitronic.

Die FAZ-Redaktion „Motor und Technik“ konnte jetzt eine Beta-Software von Nuance auf verschiedenen Geräten vom Nokia bis zum Blackberry testen. „Ein Tastendruck startet das System, man sagt beispielsweise ‚SMS an Klaus Müller auf dem Handy’. Die Software identifiziert den zugehörigen Eintrag im Telefonbuch des Geräts und bereitet das SMS-Formular vor. Mit einem weiteren Tastendruck diktiert man nun seine Nachricht, die Aufnahme landet via Mobilfunk in wenigen Sekunden bei Nuance, dort wird transkribiert und das Resultat in die SMS-Maske eingefügt. Eventuelle Fehler lassen sich flink berichtigen, weil der Nuance-Dienst zu jedem erkannten Wort mögliche und wahrscheinliche Alternativen mitschickt. Das alles klappt, wenn man sich auf ein, zwei Sätze beschränkt, deutlich schneller als die Eingabe der Nachricht per Hand, selbst wenn man ein luxuriöses Smartphone mit einer etwas größeren Tastatur hat“, schreibt der FAZ-Redakteur Michael Spehr.

Die Handy-Spracherkennung werde in Amerika zusammen mit AT&T entwickelt, in Deutschland soll ein solches System ebenfalls in Kooperation mit den Mobilfunk-Netzbetreibern starten. „Vorstellbar ist, dass manche Angebote für den Kunden sogar unentgeltlich bereitgestellt werden. Denn wenn man eine SMS schnell diktieren kann, wird man mehr davon verschicken“, so Spehr.

Was Nuance sonst noch vorhat, schilderte Marketingsdirektor Steve Chambers in seiner Eröffnungsrede auf der Conversations DACH seines Unternehmens in München.
Hier die Audioaufzeichnung:

Dumme Kundeninteraktion – Wie miserabel orchestrierte Technologien den Service verschlechtern

Bill Price, Autor des Buches „The Best Service Is No Service“, fordert von Unternehmen einen Paradigmenwechsel in der Kundenkommunikation. „Man sollte vor allen Dingen ‚dumme Kontakte’ vermeiden. Sie sind für das Unternehmen schädlich und für Kunden sehr ärgerlich“, sagte Price als Hauptredner der Fachmesse Call Center World in Berlin. Automatisierung und Selbstbedienungsservice würden häufig ohne eine klare Prozessstrategie angeboten. „Viel zu oft bieten Unternehmen entweder Self Service oder persönlichen Kundendienst. Der Self Service ist schlecht organisiert und Agenten sind gelangweilt, weil sie immer wieder die gleichen simplen Antworten geben müssen“, kritisiert Price.

Wenn eine Mobilfunkfirma die Servicerufnummer für die Freischaltung eines Handys anbietet und sich dann ein Sprachautomat meldet, der für diesen Dienst gar nicht vorbereitet ist, seien Frustrationen der Anrufer nicht zu vermeiden, so die Erfahrung von Udo Nadolski, Geschäftsführer des Beratungshause Harvey Nash in Düsseldorf: „Wenn der Handykunde dann in der Warteschleife endet, ständig Fehlermeldungen des Sprachautomaten erhält und am Ende einem Call Center-Agenten seinen Wunsch schildern muss, ist das Desaster perfekt. Wenn der Agent mir mitteilt, ich hätte dem Sprachautomaten direkt das Wort ‚Berater’ sagen müssen, weil er mit ‚Karte freischalten’ gar nichts anfangen könne, fühle ich mich schlichtweg veräppelt. Das ist in der Telekom-Branche leider die Regel und nicht die Ausnahme“, moniert Nadolski, Experte für Telekommunikation und Informationstechnik.

Man müsse den Self Service genau planen, statt den Kunden einfach einen Haufen verschiedener Möglichkeiten zur Auswahl zu geben, so der Ratschlag von Bill Price, der den Kundenservice von Amazon aufgebaut hat. „Ein perfektes Service Design der unterschiedlichen Kundenkanäle ist keine profane Angelegenheit, die man dem Zufall überlassen darf. Hier müssen sich die Unternehmen viel stärker die Brille des Kunden aufsetzen und ein Drehbuch entwickeln, um einen reibungslosen Kundenkontakt zu gewährleisten“, erklärt Nadolski. Die Verknüpfung der unterschiedlichen Kontaktkanäle zum Kunden auf einer elektronischen Plattform ist nach Auffassung von Peter Nowack, Geschäftsführer des Dortmunder Softwarehauses VoicInt, heutzutage unabdingbar. „Nur so können Missverständnisse und Dopplungen im Kundenservice verhindert und ärgerliche Medienbrüche vermieden werden. Etwa im Bankgeschäft: Überweisungen tätigen immer mehr Menschen online, bei Fragen nach Gebühren und Zinssätzen schicken die Kunden eine E-Mail, bei weiterem Informationsbedarf rufen sie an. Die Anforderungen an die Bank reichen von der einfachen Auskunft bis zur qualifizierten Beratung im persönlichen Gespräch. Alles das muss ein so genanntes Customer Interaction Portal heute bewerkstelligen“, erläutert Nowack.

Die Orchestrierung aller Kundeninteraktions-Technologien zählt zu den Schwerpunktthemen der diesjährigen Voice Days. Das teilte Bernhard Steimel, Sprecher der Initiative Voice Business, auf der Call Center World mit. „Das professionelle Servicemanagement über eine Vielzahl an Kontaktwegen ist die zentrale technologische, prozessuale und organisatorische Herausforderung für alle CIOs. Unter dem neuen Label ‚Customer Contact Days’ werden wir auf den Voice Days 2009 Strategien, Lösungen und Erfolgsbeispiele hierfür präsentieren“, führte Steimel aus. Es gehe um VoIP, integrierte Kommunikations-Plattformen, Multichannel-Lösungen und Unified Communications. Die Branchenveranstaltung findet am 6. und 7. Oktober 2009 erstmals im Messezentrum Nürnberg statt. Mit der NürnbergMesse wurde nach Angaben der Veranstalter ein neuer strategischer Partner gewonnen, mit dem man gemeinsam die Reichweite erhöhen könne durch Synergien im Marketing auch mit anderen Veranstaltungen am Standort Nürnberg. Dazu zählten vor allen Dingen die Mailingtage und die CRM-Expo. „Wir sehen, dass die Top-Player, die Mehwertdienste, Hosting oder Software für Call Center und Business Communication anbieten, einen hohen Überzeugungsaufwand bewerkstelligen müssen. Diesen Wirtschaftskreisen wollen wir eine neue Plattform bieten“, so Jens Klemann, Mitveranstalter der Voice Days und Customer Contact Days.

Computer Intelligence equals that of a lesser house fly: Telecommunication in need of a new artificial intelligence concep

In order to achieve a tangible cutting edge in the telecommunications sector, a new appreciation and overhauled concept of artificial intelligence is called for. This is the viewpoint expressed by Lars Thomsen, trend researcher at the Agency Future Matters http://www.future-matters.com. Only when appliances can boost a notably enhanced intelligence will system leaps become a feasible reality. At the moment we are still in the infancy stage of such a process“, explains Thomsen. At present the intelligence level of a computer equals that of a common house fly. Within about five years it would be realistic to assume that one has reached the intelligence level of a dog and it would take a further ten years to come up to the intelligence level of a human being. “At that time both storage/memory and bandwidth will be moving in spheres that by today´s standards is still far beyond imagination – approximately 200,000 times more efficient than today. The access to the internet will then be as ubiquitously second to nature as electricity is today. And what is more we will be in a position to delegate the great bulk of organizational tasks to Personal Assistants, thereby gaining more time to concentrate on the more pressing issues“, Thomsen expounds. 

For the television programmes this vision has already become reality. One good example to this end is the software “TV Digital Personal“ which has the capacity of connecting personalized TV-Channels based on the conventional television programme with all the internet offerings available. The programme will be generated automatically and will reflect the individual preferences and respective attitudes and behavioural patterns of the TV-viewer. “My prognosis is that all industries, whose corporate processes can be presented on the internet and all kinds of everyday life situations, in which internet-based appliances are being employed, will be governed by electronical assistants. When all appliances surrounding us will be equipped with permanent internet connections, ranging from the Intercity Express seats via motorcars, mobile phones, living room television sets, child´s beds right through to the briefcase, from that moment on at the very latest will each and everyone of us have a small intelligent assistant ready for personal use“, confirms Sven Gábor Jánszky of forward2Business-Trend Office http://www.forward2business.com. 

“Within the scope of ten years most of the service requests via voice entry will be dealt with in just one sentence“, predicts speech dialogue expert Lupo Pape, Managing Director of SemanticEdge http://www.semanticedge.de in Berlin: The future scenario would then present itself as follows: “SMS to Anne: My flight is delayed and I will not arrive until 21:00 hrs.“. And the SMS will be forwarded immediately. “Please reserve me a seat on the next train to Berlin.“ The back end systems of the Personal Assistant will then make the online-reservation and send a SMS detailling the respective connection times, the booked seat number as well as a reservation code. Yet another example: “I still need three litres of milk, three pieces of butter as well as a pumpkin seed bread“ and the retailer at the corner shop schedules the goods to be picked up or alternatively delivers the goods to the home address. With the Personal Assistant each customer has the opportunity to compilate the individual services he himself wishes to use. For the companies it will be vital to adjust to this trend by having a presence in the personalized compilation of the respective services“, predicts Pape. 

 

Voice Control on track to become key technology for mobile internet

Yahoo has announced that it will facilitate mobile internet search through its “OneSearch 2.0” service. The Company maintains that in future all there is needed is to merely speak the search term into the telephone. To ensure that the new function operates effectively also in practice Yahoo has initiated a co-operation with the Speech Recognition Specialist vlingo.com, a Company jointly set up with Mike Phillips, founder of Speechworks and subsequently Board Member of Scansoft (now Nuance). Google, too, shows considerable initiative and does not stop short of its own engagement as far as the mobile search is concerned. As a first step in this direction, the California-based Company has decided to recruit Mike Cohen, the Voice Technology Pioneer and Co-founder of Nuance in addition to a few members from his old team. Last year, equipped with its voice-controlled telephone directory 0800-GOOG-411 Google enthusiastically set about to conquer the search engine market with voice technology. The system is based on transmitting Google Maps on the telephone. While the search will effectively be triggered by speaking the response is delivered via a Text-to-Speech-System (TTS) or, alternatively, as a SMS. Microsoft confidently builds on its sound and well-established positioning with  Smartphones (Windows Mobile) and its server strategy, which with its conversion to the “Communication Server“ is set to offer an impressive range of opportunities for integrating speech applications into a mobile internet world. On numerous occasions Bill Gates, founder of Microsoft, has declared voice and speech technology the overriding key topic of the agenda on which to focus the Company´s attention. In order to make a head start towards this goal the software-giant has taken on a handful of high-calibre specialists in addition to the take-over of the service provider Angel.com.

 

A veritable trailblazer of the web-world, mobile search created a situation, in which voice automation may successfully capitalize on its extensive opportunities to its full potential, explains Bernhard Steimel, Spokes Person of Voice Days: ”Mobile phones are the modern door-opener to the internet for people who have or will never access it via the personal computer. However, special consideration must be given to the form factor, the screen size, the usage limitations as well as the disposable bandwidth. In other words there must be a guarantee that the search, the primary access to all contents and services to the internet, which undoubtedly will be more difficult from the mobile phone, is nonetheless possible without notable restrictions. It must gradually develop into an answering machine, which based on the connection of Web 2.0 and the Semantic Web, produces “right answers” instead of coughing up long link lists. Another requirement is that the mobile search is operable and serviceable without difficulty.

 

According to the experience of Lupo Pape, dialogue speech expert, the speech-controlled local search engines in the US, which with their gratituous directory systems based on audio ads placements, reap significant profits are not yet anything to write home about. “Jingle Networks with 1-800 FREE 411, Microsoft`s Tellme with 1-800-555-TELL and Google with 1-800-GOOG-411 are all concerned with the search in yellow pages, with entries such as pizza, Pizza Hut, Starbucks or MacDonalds being among the most frequently used search terms by a long chalk. From our point of view, however, these services are nothing but blind alleys, which currently still base their existence on the fact that directory services are liable to costs. They will continue to exist but will not exert a notable impact on our lives”, says Pape, Managing Director of SemanticEdge http://www.semanticedge.de.

 

By contrast, approaches adopted by mobile end devices, if yet still in their infancy and initial development stages, are set to be more compelling and gripping. ”Special attention ought to be paid to concepts and approaches like those by Yahoo und vlingo. The same applies to the Personal Assistant concept, which for instance Nuance offers with its speech-controlled applications on Blackberry. The use of voice recognition in navigation devices looks quite promising. Their objective is to simplify the usage of mobile end devices via voice control, for instance while entering the address, dictating SMS or making phone calls by means of speaking the respective name. However, companies like Nokia, Apple, Microsoft or Google, who claim to be the major players of mobile internet have not responded or presented a clear strategy in this field of action as yet. This is bound to change though as soon as initiatives like Android and the G-Phone will be presented in more concrete forms. We believe that the first end devices will be available soon”, predicts Pape.

 

Who from the service providers finally succeeds in winning the race of the mobile internet sovereignty depends on who will be in a position to combine the “battle for the best brains“ with the mightiest market power“ explains Steimel. “Google has already won the battle for the best brains. This success is not least due to Google´s approach to constantly developing new products coupled with its unique supreme quality strategy to validate with GOOG411 its own speech model in the scope of the world-wide largest pilot study. Also as far as market power is concerned, Google is still one step ahead. Mobile Google-Search not that of Yahoo or Microsoft Live Search, usually features on the front of the agenda with the majority of the telecommunications companies that offer their mobile clients a search option“, explains Steimel.