Abschied vom Tastenwahlblock – Sprachsteuerung als „Tipping Point“ des mobilen Internets

Lösungen von Nuance für die Automobilbranche
Lösungen von Nuance für die Automobilbranche
Mobile Computer und Navis setzen sich nach einem Bericht des Computer Informationsdienstes (CID) immer mehr durch. Doch wer unterwegs auf den Rechner zugreifen möchte, hat nicht immer die Hände frei oder muss die Augen auf seine Umgebung richten. Hier sehen die Marktforschungsexperten der Datamonitor Group die größten Chancen für Sprachsteuerungs-Applikationen. Die weltweiten Umsätze mit sogenannter „Advanced Speech Recognition” (ASR) sollen demnach in Smartphones und mobilen Kleinrechnern von 32,7 Millionen US-Dollar im Jahr 2009 auf 99,6 Millionen US-Dollar im Jahr 2014 steigen. Für die Spracherkennung in Fahrzeugen sagen die Analysten eine Steigerung von jetzt 64,3 Millionen US-Dollar auf 208,2 Millionen US-Dollar im Jahr 2014 voraus.

Sprachsteuerung für mobile Geräte
Sprachsteuerung für mobile Geräte
Sprachcomputer zählen auch für die Suchmaschinen zu den wichtigsten Instrumenten, um das mobile Internet bequem bedienen zu können. So bietet Yahoo ab sofort die Handy-Applikation „oneSearch Voice“ für Smartphones und das iPhone in Deutschland an. Das lästige Tippen auf der kleinen Tastatur oder dem Touch-Screen falle weg. Es genüge jetzt, den Suchbegriff per einfach auszusprechen. Die Darstellung der Ergebnisse werden für Handy-Displays optimiert angezeigt: Statt langer Linklisten liefere Yahoo nach Kategorien gegliederte Antworten. Sucht man beispielsweise mit der gesprochenen Eingabe „Bundesliga“ nach aktuellen Fußballergebnissen, erhält man eine Vielzahl von detaillierten Resultaten wie aktuelle Spielstände, Tabellenübersichten, Fotos sowie weiterführende Links. Die Ergebnisse sind nach Angaben von Yahoo übersichtlich in Kategorien aufbereitet. „Das System ist lernfähig: Es passt sich immer besser an die individuelle Sprechweise seines Nutzers an, je häufiger es eingesetzt wird. Während die meisten mobilen Spracherkennungssysteme auf einzelne Kategorien wie lokale Suchen spezialisiert sind, bietet wir den Nutzern die Möglichkeit, offene Suchanfragen zu stellen – mit hoch relevanten Ergebnissen für jede Art von Spracheingabe“, erklärt Michael Stenberg, Partner Director Central & Eastern Europe Yahoo! Mobile. Stenberg. Wer es dennoch lieber klassisch mag, könne nach wie vor auch die herkömmliche Texteingabe nutzen.

tipping pointDurch das Spracherkennungs-Feature will Yahoo seine Position als zentraler Einstiegspunkt ins mobile Internet festigen. Die Applikation kann unter http://de.m.yahoo.com/voice direkt auf unterstützte Handys oder über den iTunes Store auf das iPhone heruntergeladen werden. Die Sprachsteuerung wird von Web 2.0-Pionier Tim O’Reilly http://radar.oreilly.com sogar als „Tipping Point“ gewertet: Der Begriff bezeichnet jenen Moment, in dem etwas Einzigartiges zum Normalzustand wird und einen qualitativen Umschlagspunkt markiert. „Es ist es an der Zeit, Telefone als erstklassige Geräte zu sehen, um auf das Internet zugreifen zu können, und nicht nur als Möglichkeit, Inhalte und Anwendungen umzuwidmen, die ursprünglich dazu gedacht waren, mit einer Tastatur und einem Bildschirm gelesen zu werden“, meint O’Reilly.

Tastenwahlblock auch digital bislang nicht tot zu kriegen
Tastenwahlblock auch digital nicht tot zu kriegen
Auch in der ITK-Branche erwartet man Impulse von der Sprachsteuerung: „Computer werden heute immer noch primär über eine Tastatur bedient, die aus der Schreibmaschine entstanden ist, so als ob jeder Tastendruck einen mechanischen Hebel in Bewegung setzt. Selbst der Zeilenvorschub und Wagenrücklauf alias Carriage return ist uns erhalten geblieben, obwohl damit schon lange kein Papier mehr transportiert wird. Telefone haben zwar die Revolution von der Wählscheibe hin zur – in der Regel – 3×4 Tastatur gemacht, standardisiert nach ITU E.161, das erfolgte aber bereits in den 70er Jahren. Selbst moderne Handys und Smartphones halten sich noch an den Tastenwahlblock, entweder in mechanischer Ausführung oder als Icon-Darstellung auf einem Touchscreen“, weiß Andreas Latzel, Deutschland-Chef des ITK-Spezialisten Aastra, der viel Wert auf die Benutzerfreundlichkeit seiner Systeme legt. Die Technikentwicklung verlaufe zwar rasant, im Kern aber immer noch traditionell. Vorhersehbar sei, dass der Tastaturblock an seine Grenzen stoße – spätestens mit der breiten Einführung der SIP-Telefonie und der SIP-Teilnehmeradressen.

„Anders als bei professionellen Tischgeräten kommt die Ausstattung von Handys mit alphanumerischen Tastaturen zwar auch vor, ist aber in der Regel wegen der beschränkten Abmessungen nicht befriedigend. Da bietet sich der Weg zum Sprachinterface an: der Ansage von Adressen oder Einträgen des Telefonbuchs in normaler Sprachform. Sinnvoll ist das beim Autofahren oder anderen Tätigkeiten, die beide Hände verlangen“, erläutert Latzel. Noch interessanter werde die Sprachsteuerung nach Ansicht von SemanticEdge-Geschäftsführer Lupo Pape, wenn Wissen über die Domäne und Dialogintelligenz hinzukommen. „Dann kann man von Sprachdialogsystemen sprechen. Das ist das, was wir mit dem Personal Assistant umsetzen. Dazu müssen die Wissensgebiete semantisch aufbereitet und Dialogstrategien hinterlegt werden. Die wichtigsten Use-Cases gilt es zu modellieren“, resümiert Pape.

Antwortmaschine als Google-Killer? Aufregung in der Blogosphäre

Eine neue Suchmaschine versetzt angeblich die Blogosphäre in Aufregung. Das berichtet die Financial Times Deutschland. Der Wissenschaftler Stephen Wolfram soll einen „Google-Killer“ entwickelt haben. „Doch den glaubten vor ihm schon viele erfunden zu haben“, so die FTD.

„Da schreibt Nova Spivack, Suchmaschinenexperte aus San Francisco, einen begeisterten Blogeintrag über Professor Wolframs neueste Entwicklung. Über eine Suchmaschine, die angeblich spezifische, sachbezogene Fragen viel präziser beantworten kann als jede andere Suchmaschine“, berichtet die FTD.

Sein Dienst könnte nach Meinung von Suchmaschinenexperten nicht nur sehr nützlich, sondern im Internet auch einflussreich werden. „Aber ein Google ist Wolfram Alpha deswegen noch nicht, auch wenn Spivack seinen Blogeintrag vollmundig mit ‚Wolfram Alpha kommt – und es könnte so wichtig wie Google sein‘ überschreibt. Was genau kommt, wird die Welt erst im Mai wissen, wenn die Website an den Start geht“, führt die FTD weiter aus.

Das Rätsel ist auch schnell entlüftet, denn das Ganze soll als Antwortmaschine funktionieren – läuft also auf den Pfaden von semantischen Technologien. Sie wird, anders als Google, auf eine Suchanfrage nicht einfach Links auflisten, die eine Antwort auf die Frage des Nutzers enthalten könnten. Stattdessen analysiert die Technologie Fragen, auf die es sachbezogene Antworten gibt – und liefert diese. Sie soll eine große Auswahl in „natürlicher“ Sprache gestellter Fragen beantworten können, schreibt Spivack, der vergangene Woche zwei Stunden mit Wolfram gesprochen hat und sich dessen Onlineservice vorführen ließ. Ja toll. Konzepte für die so genannte Antwortmaschine werden an vielen Stellen zur Zeit entwickelt. In Deutschland arbeitet das Deutsche Forschungszentrum für Künstliche Intelligenz am Web 3.0-Standard. Mit dem von der Bundesregierung geförderten Projekt Theseus soll die Marktreife erreicht werden. Auch bei Google. Ich habe darüber schon mehrfach berichtet. So einfach lassen sich die Google-Forscher nicht die Butter vom Brot nehmen. Bei der Sprachsteuerung sind die Jungs nur schwer zu toppen. Weiteres hier.

Was kommt nach der Google-Ära und welche Chancen haben Konkurrenten?

Analysten von Forrester Research zufolge könnte es sich trotzdem bald ausgegoogelt haben. Das veröffentliche der Themenblog. Die Analysten wollen herausgefunden haben, dass alternative Suchen wie AltaVista, Yahoo oder Lycos gute Chancen haben. In ihrer neuesten Studie belegen sie, dass die Markentreue von Suchmaschinennutzern sehr gering ist. Außerdem ist es für den User einfach, auf zu einer anderen Suche zu wechseln. Das macht den Suchmaschinenmarkt zu einem offenen Spielfeld – für alle Player.

An der Umfrage beteiligten sich über 4.800 erwachsene US-Bürger: sie berichteten von ihrem Suchverhalten und wurden nicht getrackt. Demnach hat Google im Gegensatz zu den comScore-Ergebnissen aber nur einen Anteil von 59 Prozent. Nur 20 Prozent der Studienteilnemer verlassen sich auf Google allein und benutzen lieber mehrere Suchen. Acht Prozent gaben an, ausschließlich Yahoo zu benutzen. Für AOL blieben drei Prozent exklusive Nutzer und für MSN gerade mal eines übrig.

Trotzdem, so fasst die Adweek zusammen, gibt es Hoffnung für die Hauptkonkurrenten Microsoft und Yahoo, die sich gegen Google aufrüsten. Gerade Yahoo habe deutliche Vorteile: im Gegenteil zu Google nutzen bis zu 30 Prozent die Suchseite als ihre Startseite. Blöd nur, dass gerade mal die Hälfte davon die Yahoo-Suche auch nutzen.

Potenzial gibt es für Yahoo und Co. laut Forrester-Untersuchung vor allem darin, eine andere Art der Suchfunktion zur Verfügung zu stellen. Die Befragten gaben an, dass sie zwar bei Google gut zu einem bestimmten Thema informiert werden. Microsoft und Yahoo liefern dagegen bessere Nachrichten und Inhalte zu Finanz und Medien-Themen. Das ist eine ziemlich beschränkte Sichtweise von Forrester und erinnert ein wenig an die verzweifelten versuche von Microsoft, mit einem eigenen MP3-Player namens Zune dem Konkurrenten Apple Marktanteile abzujagen. Nur vergisst man dabei das Gesamtpaket von Apple. Mit iTunes, den kultigen iPods und dem iPhone, den Apps und vielen sinnvollen Hifi-Geräten bis hin zum Airport hat Apple eine eigene Welt geschaffen, die man in den nächsten Jahren kaum knacken kann. Ähnliches praktiziert Google über Dienste, die weit über die Suchmaschinen-Funktion hinausgehen. Hier sind einfach sehr intelligente Forscher am Werk, die sich nicht auf die reine Suche im Netz reduzieren. Die Kombination vieler Services macht Google so stark.

Yahoo rüstet sich zur Abwehrschlacht – Analysten raten zur Fusion mit Microsoft

Der Internet-Konzern Yahoo http://info.yahoo.com will sich den Übernahmeplänen des Software-Riesen Microsoft nicht beugen – auch gegen die Kritik von Großaktionären wie US-Milliardär Carl Icahn. So stellt Yahoo seine Direktoriumsmitglieder erneut zur Wiederwahl für die Hauptversammlung auf. Gleichzeitig werde das Kontrollgremium wegen des Rücktritts von Edward Kozel um einen Sitz auf neun reduziert, wie aus einer Pflichtmitteilung hervorging. Zudem verschob Yahoo seine Aktionärsversammlung vom 3. Juli auf Ende Juli. Das Unternehmen teilte weiter mit, neben Großaktionär Icahn hätten noch weitere Investoren Yahoo darüber informiert, dass sie auf der Hauptversammlung eigene Kandidaten für das Kontrollgremium ins Rennen schicken wollten. So würden sich zwei Aktionäre, bei denen es sich jeweils nicht um Icahn handle, selbst zur Wahl stellen. Ein weiterer Aktionär habe Yahoo mitgeteilt, er wolle auf der Hauptversammlung wie Icahn gleich eine komplette Mannschaft für das Direktorium durchsetzen. Die von Icahn bereits benannten Kandidaten bezeichnete Yahoo als eine schlechte Wahl, die nicht im besten Interesse der Aktionäre sei. Das Vorhaben von Icahn solle eine Übernahme durch Microsoft ermöglichen. 

Analysten wie Voice Days-Sprecher Bernhard Steimel halten einen Zusammenschluss von Microsoft und Yahoo für überlebenswichtig. „Nur so können beide Konzerne ihre Stärken bündeln und gegen Google bestehen. Gelingt es Microsoft, Windows Mobile ähnlich wie Windows XP im PC-Markt zum Quasistandard für Betriebssysteme bei Smart Phones zu machen und die Infrastrukturen mit den Communication Servern flächendeckend zu verbreiten, kann der Redmond-Konzern mit der Übernahme von Yahoo zum großen Gegenschlag ausholen“, so Steimel im Interview mit dem Onlinemagazin NeueNachricht http://www.ne-na.de

Es gehe vor allen Dingen um die Hoheit beim mobilen Internet. „Hier hat Google einfach mehr zu bieten. Auf der ersten Seite der meisten TK-Unternehmen, die ihren mobilen Kunden eine Suche anbieten, steht in der Regel die mobile Google-Suche, nicht die von Yahoo oder Microsoft Live Search“, resümiert Steimel.

Voice Control on track to become key technology for mobile internet

Yahoo has announced that it will facilitate mobile internet search through its “OneSearch 2.0” service. The Company maintains that in future all there is needed is to merely speak the search term into the telephone. To ensure that the new function operates effectively also in practice Yahoo has initiated a co-operation with the Speech Recognition Specialist vlingo.com, a Company jointly set up with Mike Phillips, founder of Speechworks and subsequently Board Member of Scansoft (now Nuance). Google, too, shows considerable initiative and does not stop short of its own engagement as far as the mobile search is concerned. As a first step in this direction, the California-based Company has decided to recruit Mike Cohen, the Voice Technology Pioneer and Co-founder of Nuance in addition to a few members from his old team. Last year, equipped with its voice-controlled telephone directory 0800-GOOG-411 Google enthusiastically set about to conquer the search engine market with voice technology. The system is based on transmitting Google Maps on the telephone. While the search will effectively be triggered by speaking the response is delivered via a Text-to-Speech-System (TTS) or, alternatively, as a SMS. Microsoft confidently builds on its sound and well-established positioning with  Smartphones (Windows Mobile) and its server strategy, which with its conversion to the “Communication Server“ is set to offer an impressive range of opportunities for integrating speech applications into a mobile internet world. On numerous occasions Bill Gates, founder of Microsoft, has declared voice and speech technology the overriding key topic of the agenda on which to focus the Company´s attention. In order to make a head start towards this goal the software-giant has taken on a handful of high-calibre specialists in addition to the take-over of the service provider Angel.com.

 

A veritable trailblazer of the web-world, mobile search created a situation, in which voice automation may successfully capitalize on its extensive opportunities to its full potential, explains Bernhard Steimel, Spokes Person of Voice Days: ”Mobile phones are the modern door-opener to the internet for people who have or will never access it via the personal computer. However, special consideration must be given to the form factor, the screen size, the usage limitations as well as the disposable bandwidth. In other words there must be a guarantee that the search, the primary access to all contents and services to the internet, which undoubtedly will be more difficult from the mobile phone, is nonetheless possible without notable restrictions. It must gradually develop into an answering machine, which based on the connection of Web 2.0 and the Semantic Web, produces “right answers” instead of coughing up long link lists. Another requirement is that the mobile search is operable and serviceable without difficulty.

 

According to the experience of Lupo Pape, dialogue speech expert, the speech-controlled local search engines in the US, which with their gratituous directory systems based on audio ads placements, reap significant profits are not yet anything to write home about. “Jingle Networks with 1-800 FREE 411, Microsoft`s Tellme with 1-800-555-TELL and Google with 1-800-GOOG-411 are all concerned with the search in yellow pages, with entries such as pizza, Pizza Hut, Starbucks or MacDonalds being among the most frequently used search terms by a long chalk. From our point of view, however, these services are nothing but blind alleys, which currently still base their existence on the fact that directory services are liable to costs. They will continue to exist but will not exert a notable impact on our lives”, says Pape, Managing Director of SemanticEdge http://www.semanticedge.de.

 

By contrast, approaches adopted by mobile end devices, if yet still in their infancy and initial development stages, are set to be more compelling and gripping. ”Special attention ought to be paid to concepts and approaches like those by Yahoo und vlingo. The same applies to the Personal Assistant concept, which for instance Nuance offers with its speech-controlled applications on Blackberry. The use of voice recognition in navigation devices looks quite promising. Their objective is to simplify the usage of mobile end devices via voice control, for instance while entering the address, dictating SMS or making phone calls by means of speaking the respective name. However, companies like Nokia, Apple, Microsoft or Google, who claim to be the major players of mobile internet have not responded or presented a clear strategy in this field of action as yet. This is bound to change though as soon as initiatives like Android and the G-Phone will be presented in more concrete forms. We believe that the first end devices will be available soon”, predicts Pape.

 

Who from the service providers finally succeeds in winning the race of the mobile internet sovereignty depends on who will be in a position to combine the “battle for the best brains“ with the mightiest market power“ explains Steimel. “Google has already won the battle for the best brains. This success is not least due to Google´s approach to constantly developing new products coupled with its unique supreme quality strategy to validate with GOOG411 its own speech model in the scope of the world-wide largest pilot study. Also as far as market power is concerned, Google is still one step ahead. Mobile Google-Search not that of Yahoo or Microsoft Live Search, usually features on the front of the agenda with the majority of the telecommunications companies that offer their mobile clients a search option“, explains Steimel.