Fünfte Webrevolution bringt Systeme, die über Sprache und Gesten gesteuert werden – Handys als virtuelle Alltagsbegleiter

Wer kennt das nicht: Unterwegs im Auto wäre es eigentlich an der Zeit, einen wichtigen Anruf zu tätigen. Die Nummer ist allerdings gerade nicht verfügbar oder ein Zugriff auf das Adressbuch des Handys nicht gefahrlos möglich – der Anruf wird daher verschoben. Unter dem Strich nicht nur ärgerlich, sondern für Firmen auch teuer. Denn zusammengerechnet entstehen für mobile Mitarbeiter durch vergleichbare Versäumnisse jährlich beträchtliche Zeitverluste. Durch moderne Sprachdialogsysteme soll sich das ändern. „Innovative Sprachanwendungen werden in Zukunft ein ständiger virtueller Begleiter des mobilen Menschen sein“, prognostiziert Lupo Pape, Sprachdialogexperte und Geschäftsführer von SemanticEdge http://www.semanticedge.com.  
Sein Berliner Unternehmen arbeitet an Software-Lösungen, um mobile Endgeräte über Sprache steuern zu können. Virtuelle persönliche Assistenten sollen dabei nicht nur per Spracherkennung Telefonverbindungen herstellen und das SMS-Diktat auf dem Handy ermöglichen, sondern in Verbindung mit einem Service wie Wikipedia oder Google auf anspruchsvollere Fragen wie „Wer war Simone de Beauvoir?“ oder „Wo ist das nächste Starbucks-Cafe?“ Antwort geben. 
 
Bereits heute ist ein Teil dieser Vision Realität: Der persönliche Assistent, wie er Daimler entwickelt wurde, ist eine Vermittlungs- und Assistenzanwendung für die Mitarbeiter des Konzerns. „Das System liest während der Fahrt E-Mails vor oder sucht den nächsten Zug für die Weiterfahrt mit der Bahn. Es kennt sowohl das private als auch geschäftliche Adressbuch seines Nutzers und baut nach einer Spracheingabe wie etwa ‚Martin Meyer Handy’ sofort die entsprechende Verbindung auf“, erläutert Pape.
 
Grundlage dafür sei die Verbundworterkennung. So könne das System nicht nur einzelne Wörter, sondern auch Wortkombinationen identifizieren. „Diese Fähigkeit ist eine weitere Stufe auf dem beschwerlichen Weg zum Ziel: Die Erkennung menschlicher Sprache ohne Einschränkung des Vokabulars“, weiß Pape.
 
Das System ist an einen Least-Cost-Router angeschlossen, entscheidet sich daher automatisch für die günstigste Telefonverbindung und verwirklicht zudem ein so genanntes One-Number-Konzept für die ständige Erreichbarkeit der Mitarbeiter. „Sie sind überall unter einer Durchwahl erreichbar und bieten Ihren Kunden und Partnern einen perfekten Service“, skizziert Pape die Vorteile der Anwendung, die nach Auffassung von Microsoft-Chef Steve Ballmer zukunftsweisend ist: „Zig verschiedene Telefonnummern oder Adressen werden überflüssig“, betonte Ballmer in seiner Cebit-Eröffnungsrede. Nach seiner Einschätzung stehen wir vor einer fünften Web-Revolution. Sie werde geprägt von enormen Rechenkapazitäten und einem quasi unendlichen Speicherplatz. „Hochgeschwindigkeitsverbindungen sind allgegenwärtig und die Systeme können mit Sprache und Gesten bedient werden“, sagte Ballmer.
 
Unter dem Motto „Mit Sprache mehr erreichen“ wird auch der Fachkongress Voice Days http://www.voicedays.de vom 15. bis 16. Oktober Entwicklungen in Wiesbaden präsentieren, die alle relevanten Gebiete und Medien der Sprachverarbeitung einschließen: „Es geht um Spracherkennung als Eingabe- oder Ausgabemedium für Handys, um Stimmerkennung, die Suche von Audioinhalten, den Zugang zu Internet-Informationen oder den Einsatz im Mitmach-TV“, sagt Veranstalter Jens Klemann von der Bad Homburger Unternehmensberatung Strateco http://www.strateco.de. Im Trendforum der Voice Days werden die wichtigsten Innovationsgebiete vorgeführt: „Mobile Services powered by Voice oder Diktierfunktionen und Voicemail-Reader, Multichannel-Lösungen und Sprach-Biometrie für sicheres Telefon- und Online-Banking. Auch Analyse-Tools zur Qualitätssicherung, Perspektiven für Voice Web 3.0 und das semantisches Web gehören zu den Zukunftsthemen, die wir thematisieren“, so der Ausblick von Klemann.