Abschied vom Tastenwahlblock – Sprachsteuerung als „Tipping Point“ des mobilen Internets

Lösungen von Nuance für die Automobilbranche
Lösungen von Nuance für die Automobilbranche
Mobile Computer und Navis setzen sich nach einem Bericht des Computer Informationsdienstes (CID) immer mehr durch. Doch wer unterwegs auf den Rechner zugreifen möchte, hat nicht immer die Hände frei oder muss die Augen auf seine Umgebung richten. Hier sehen die Marktforschungsexperten der Datamonitor Group die größten Chancen für Sprachsteuerungs-Applikationen. Die weltweiten Umsätze mit sogenannter „Advanced Speech Recognition” (ASR) sollen demnach in Smartphones und mobilen Kleinrechnern von 32,7 Millionen US-Dollar im Jahr 2009 auf 99,6 Millionen US-Dollar im Jahr 2014 steigen. Für die Spracherkennung in Fahrzeugen sagen die Analysten eine Steigerung von jetzt 64,3 Millionen US-Dollar auf 208,2 Millionen US-Dollar im Jahr 2014 voraus.

Sprachsteuerung für mobile Geräte
Sprachsteuerung für mobile Geräte
Sprachcomputer zählen auch für die Suchmaschinen zu den wichtigsten Instrumenten, um das mobile Internet bequem bedienen zu können. So bietet Yahoo ab sofort die Handy-Applikation „oneSearch Voice“ für Smartphones und das iPhone in Deutschland an. Das lästige Tippen auf der kleinen Tastatur oder dem Touch-Screen falle weg. Es genüge jetzt, den Suchbegriff per einfach auszusprechen. Die Darstellung der Ergebnisse werden für Handy-Displays optimiert angezeigt: Statt langer Linklisten liefere Yahoo nach Kategorien gegliederte Antworten. Sucht man beispielsweise mit der gesprochenen Eingabe „Bundesliga“ nach aktuellen Fußballergebnissen, erhält man eine Vielzahl von detaillierten Resultaten wie aktuelle Spielstände, Tabellenübersichten, Fotos sowie weiterführende Links. Die Ergebnisse sind nach Angaben von Yahoo übersichtlich in Kategorien aufbereitet. „Das System ist lernfähig: Es passt sich immer besser an die individuelle Sprechweise seines Nutzers an, je häufiger es eingesetzt wird. Während die meisten mobilen Spracherkennungssysteme auf einzelne Kategorien wie lokale Suchen spezialisiert sind, bietet wir den Nutzern die Möglichkeit, offene Suchanfragen zu stellen – mit hoch relevanten Ergebnissen für jede Art von Spracheingabe“, erklärt Michael Stenberg, Partner Director Central & Eastern Europe Yahoo! Mobile. Stenberg. Wer es dennoch lieber klassisch mag, könne nach wie vor auch die herkömmliche Texteingabe nutzen.

tipping pointDurch das Spracherkennungs-Feature will Yahoo seine Position als zentraler Einstiegspunkt ins mobile Internet festigen. Die Applikation kann unter http://de.m.yahoo.com/voice direkt auf unterstützte Handys oder über den iTunes Store auf das iPhone heruntergeladen werden. Die Sprachsteuerung wird von Web 2.0-Pionier Tim O’Reilly http://radar.oreilly.com sogar als „Tipping Point“ gewertet: Der Begriff bezeichnet jenen Moment, in dem etwas Einzigartiges zum Normalzustand wird und einen qualitativen Umschlagspunkt markiert. „Es ist es an der Zeit, Telefone als erstklassige Geräte zu sehen, um auf das Internet zugreifen zu können, und nicht nur als Möglichkeit, Inhalte und Anwendungen umzuwidmen, die ursprünglich dazu gedacht waren, mit einer Tastatur und einem Bildschirm gelesen zu werden“, meint O’Reilly.

Tastenwahlblock auch digital bislang nicht tot zu kriegen
Tastenwahlblock auch digital nicht tot zu kriegen
Auch in der ITK-Branche erwartet man Impulse von der Sprachsteuerung: „Computer werden heute immer noch primär über eine Tastatur bedient, die aus der Schreibmaschine entstanden ist, so als ob jeder Tastendruck einen mechanischen Hebel in Bewegung setzt. Selbst der Zeilenvorschub und Wagenrücklauf alias Carriage return ist uns erhalten geblieben, obwohl damit schon lange kein Papier mehr transportiert wird. Telefone haben zwar die Revolution von der Wählscheibe hin zur – in der Regel – 3×4 Tastatur gemacht, standardisiert nach ITU E.161, das erfolgte aber bereits in den 70er Jahren. Selbst moderne Handys und Smartphones halten sich noch an den Tastenwahlblock, entweder in mechanischer Ausführung oder als Icon-Darstellung auf einem Touchscreen“, weiß Andreas Latzel, Deutschland-Chef des ITK-Spezialisten Aastra, der viel Wert auf die Benutzerfreundlichkeit seiner Systeme legt. Die Technikentwicklung verlaufe zwar rasant, im Kern aber immer noch traditionell. Vorhersehbar sei, dass der Tastaturblock an seine Grenzen stoße – spätestens mit der breiten Einführung der SIP-Telefonie und der SIP-Teilnehmeradressen.

„Anders als bei professionellen Tischgeräten kommt die Ausstattung von Handys mit alphanumerischen Tastaturen zwar auch vor, ist aber in der Regel wegen der beschränkten Abmessungen nicht befriedigend. Da bietet sich der Weg zum Sprachinterface an: der Ansage von Adressen oder Einträgen des Telefonbuchs in normaler Sprachform. Sinnvoll ist das beim Autofahren oder anderen Tätigkeiten, die beide Hände verlangen“, erläutert Latzel. Noch interessanter werde die Sprachsteuerung nach Ansicht von SemanticEdge-Geschäftsführer Lupo Pape, wenn Wissen über die Domäne und Dialogintelligenz hinzukommen. „Dann kann man von Sprachdialogsystemen sprechen. Das ist das, was wir mit dem Personal Assistant umsetzen. Dazu müssen die Wissensgebiete semantisch aufbereitet und Dialogstrategien hinterlegt werden. Die wichtigsten Use-Cases gilt es zu modellieren“, resümiert Pape.

2 Gedanken zu “Abschied vom Tastenwahlblock – Sprachsteuerung als „Tipping Point“ des mobilen Internets

  1. Laut einer aktuellen Studie „Automotive Voice User Interface Survey“, die Nuance mit Maix Research and Consulting in Deutschland 2008 durchgeführt hat, verlassen sich immer mehr Autofahrer auf die Sprachsteuerung von Navigations- und Infotainment-Systemen: Acht von neuen Fahrern, deren Fahrzeug mit einem sprachaktivierten On-Board-Infotainment- und -Navigationssystem ausgerüstet ist, nutzen regelmäßig Sprachlösungen, um Fahrzeugfunktionen zu steuern oder das Navigationssystem zu bedienen. Außerdem ermittelte die Studie eine Nutzerzufriedenheit von 73 Prozent. Diese Nutzer würden nicht nur Sprachsteuerung an Freunde und Familienmitglieder weiterempfehlen, sondern wieder ein Fahrzeug erwerben, in dem sie bestimmte Funktionen wie Radio, Telefon oder Navigation per Sprache bedienen. Weitere Ergebnisse dieser Studie: Eingabe von Telefonnummern und Navigationszielen sind die am häufigsten verwendeten Sprachfunktionen: Von den Befragten, die Spracherkennungssysteme regelmäßig nutzen, stellen 83 Prozent immer oder häufig Telefonverbindungen per Spracheingabe her und nehmen 80 Prozent der eingehenden Anrufe auf diese Weise an. 76 Prozent geben ein Routenziel regelmäßig über Sprache ein.

    Aber Sprachsteuerung im Auto ist nicht der einzigste Wachstumsmarkt: Nuance bietet Sprachsteuerung auch für Mobiltelefone. Dies ist insbesondere intererssant für Mobilfunk-Unternehmen von mobilen Diensten, wie Informationssuche, Messaging und zusätzliche vom Verbraucher drahtlos generierte Inhalte. Der vereinfachte Zugang zu diesen Funktionen erhöht für Mobilfunk-Unternehmen und OEM-Hersteller die Chance, ihre Kunden stärker an sich zu binden oder Kosten durch Self Services direkt am Mobiltelefon einzusparen. Per Sprache können beispielweise Rufnummern gewählt („Wähle Rickis Mobilnummer“), das Web durchsucht („Suche Tickets für das nächste Schalke-Spiel.“), Texte und E-Mails diktiert („Sende Text an Kathrin Schmitz; Hallo Kati, treffen wir uns in zwanzig Minuten an der Hotelbar, bevor wir zum Konzert gehen?“) oder Musik gesucht werden („Suche „Umbrella“ von Rihanna.”) . Man kann leicht und bequem per Sprache navigieren („Suche den Weg zur Königsallee 59, Düsseldorf.“) , Rechnungen selbständig zahlen oder Guthaben selbständig aufzuladen, ohne einen Mitarbeiter zu involvieren.

  2. @Anja: bin gespannt, wann der Durchbruch im Massenmarkt gelingt. Überfällig und sinnvoll sind die Anwendungsfelder allemal.

Kommentar verfassen