Handy zum Diktat: Textnachrichten mit Spracherkennungssoftware verfassen – Nuance startet Kooperation mit Netzbetreibern

Bommer-Rede auf der Conversations in MünchenEin großes Potential für die automatische Spracherkennung sieht Nuance-Generalmanager Michael-Maria Bommer im Mobilfunk. Ich hatte dazu bereits einen Artikel für NeueNachricht geschrieben. Nach Aussagen von Bommer sind Softwarelösungen seines Unternehmens zur Handysteuerung bereits auf rund vier Milliarden Endgeräten vorinstalliert. „In diesem Jahr werden weltweit 1,1 Milliarden Handys ausgeliefert. Auf 880 Millionen Geräten ist Nuance-Technologie im Betriebssystem integriert. Insgesamt gibt es für die mobile Kommunikation zur Zeit die innovativsten und prägendsten Entwicklungen. Beispielsweise das Diktieren von SMS. Sie sprechen eine Botschaft ins Handy, die von dort an unseren Server geschickt, transkripiert und innerhalb von einer Sekunde als Text zurückgeschickt wird. Die Qualität, der Komfort und die Sicherheit, die mit diesem System etwa während der Autofahrt erzielt wird, ist enorm“, sagte Bommer auf der Fachkonferenz „Conversations“ in München. Davon sind auch andere Branchenexperten überzeugt.

„Wer Textnachrichten auf dem Handy verfassen will, muss immer noch viele Beschränkungen hinnehmen. Am Format der Endgeräte wird sich nicht viel ändern. Die Tastatur in unterschiedlichen Variationen ist für viele Menschen einfach zu klein. Sprachsteuerung wird sich hier über kurz oder lang durchsetzen, nicht nur beim Schreiben von Kurznachrichten, sondern auch bei Suchfunktionen“, prognostiziert Peter Weilmuenster, Vorstandschef des ITK-Dienstleisters Bitronic.

Die FAZ-Redaktion „Motor und Technik“ konnte jetzt eine Beta-Software von Nuance auf verschiedenen Geräten vom Nokia bis zum Blackberry testen. „Ein Tastendruck startet das System, man sagt beispielsweise ‚SMS an Klaus Müller auf dem Handy’. Die Software identifiziert den zugehörigen Eintrag im Telefonbuch des Geräts und bereitet das SMS-Formular vor. Mit einem weiteren Tastendruck diktiert man nun seine Nachricht, die Aufnahme landet via Mobilfunk in wenigen Sekunden bei Nuance, dort wird transkribiert und das Resultat in die SMS-Maske eingefügt. Eventuelle Fehler lassen sich flink berichtigen, weil der Nuance-Dienst zu jedem erkannten Wort mögliche und wahrscheinliche Alternativen mitschickt. Das alles klappt, wenn man sich auf ein, zwei Sätze beschränkt, deutlich schneller als die Eingabe der Nachricht per Hand, selbst wenn man ein luxuriöses Smartphone mit einer etwas größeren Tastatur hat“, schreibt der FAZ-Redakteur Michael Spehr.

Die Handy-Spracherkennung werde in Amerika zusammen mit AT&T entwickelt, in Deutschland soll ein solches System ebenfalls in Kooperation mit den Mobilfunk-Netzbetreibern starten. „Vorstellbar ist, dass manche Angebote für den Kunden sogar unentgeltlich bereitgestellt werden. Denn wenn man eine SMS schnell diktieren kann, wird man mehr davon verschicken“, so Spehr.

Was Nuance sonst noch vorhat, schilderte Marketingsdirektor Steve Chambers in seiner Eröffnungsrede auf der Conversations DACH seines Unternehmens in München.
Hier die Audioaufzeichnung:

Amazing Race: Diktiersoftware Dragon gewinnt gegen die Meisterin im Schnellschreiben

Meisterin im SchnellschreibenSpracherkennung ist nicht nur für Ärzte und Juristen ein heißes Thema. In vielen Berufen muss ein hohes Schreibaufkommen unter Zeitdruck bewältigt werden. „Kein Wunder, dass immer mehr Krankenhäuser und Gerichte nach neuen Wegen suchen. Da ist zunächst der Umstieg auf die Digitaltechnik, die das mühsame Hantieren mit Kassettenbändern ersetzt und zudem den elektronischen Transport der Diktate erlaubt. Dass die Akustik solcher Aufzeichnungen deutlich besser ist, kommt als angenehmer Nebeneffekt hinzu. Der zweite Schritt ist der Übergang zur elektronischen Spracherkennung am PC, wobei in der Regel die Standardsoftware Dragon Naturally Speaking für Windows zum Einsatz kommt. Kein anderes Programm hat eine vergleichbar hohe Erkennungsleistung“, schreibt beispielsweise Michael Spehr von der FAZ.

Wozu Maschinen schon jetzt in der Lage sind, stellte ein Amazing Race am 11. November 2009 in München auf dem Fachkongress Conversations DACH unter Beweis. In einem Mensch-gegen-Maschine-Wettkampf trat Martina Wichers, Deutsche Meisterin im Schnellschreiben, gegen das Spracherkennungssystem Dragon Naturally Speaking von Nuance an. Frau Wichers war unheimlich schnell. Das beweist mein Mitschnitt. Die Software brauchte allerdings nur die Hälfte der Zeit. Hier der Film.
Foto Amazing Race

Last Call – Horror per Handy: Werbeagentur Jung von Matt konzipiert sprachgesteuerten Kinofilm

Spracherkennung und die Sprachsteuerung von Geräten oder Suchmaschinen sind schon längst keine Zukunftsmusik mehr. Vor allen Dingen im Mobilfunk setzt man auf neue Steuerungsmöglichkeiten und Applikationen. „Wer die schlauesten Handy-Anwendungen anbietet, wird den Mobilfunkmarkt der Zukunft beherrschen“, berichtet beispielsweise Spiegel Online. „Stellen Sie sich eine Handy-Anwendung vor, die über einen Tastsensor Ihren Stresslevel misst und die zu ihrem Gemütszustand passende Musik abspielt. Dass Sie die Nummer des Notrufs wählen und ein Arzt, der sich zufällig in einem benachbarten Gebäude aufhält, automatisch darüber informiert wird. Oder dass Sie Ihr Smartphone in der Stadt auf Gebäude richten und das Telefon ihnen anzeigt, wie ihre Umgebung vor 50 oder 100 Jahren ausgesehen haben dürfte“, so Spiegel Online.

Augmented Reality, erweiterte Realität, heiße das Schlagwort für solche Tech-Visionen, die Wissenschaftlern zufolge in den kommenden Jahren die Mobilfunkbranche durcheinanderwirbeln könnten. Es gehe um Bilder und Videos, um Informationsschilder und Töne, die das Smartphone dem Nutzer an Ort und Stelle aus dem Internet saugt und auf dem Display mit dem Abbild der Wirklichkeit kombiniert. Das Handy werde so zu einer Art Sinneserweiterung. Was man mit Sprachsteuerung schon heute mit Handys veranstalten kann, beweist der interaktive Horrorfilm „Last Call“ von der Werbeagentur Jung von Matt. Hier können Kinobesucher aktiv ins Geschehen eingreifen. „Wir wollen zwei Grenzen aufheben: die eine zwischen Film und Game, die andere zwischen Handlung und Zuschauer“, erklärt Andreas Henke, Creative Director von Jung von Matt, im Interview mit NeueNachricht.

Die strikte Trennung von Leinwand und Handlung soll gesprengt werden. „Hier der passive Zuschauer hinter seinem riesigen Popcorn-Becher. Vielleicht sollte man den Erfolg unseres Films an der Zahl ungewollt umgestoßener Popcorn-Becher messen“, sagt Henke. Seine Agentur möchte dem Kunden 13th Street und den Zuschauern ein innovatives Markenerlebnis bieten: „Kurz gesagt: guten modernen Horror. Gerade das Horrorgenre hat in der Vergangenheit sehr innovative Projekte geliefert. Wie vor einigen Jahren ‚Blair Witch Projekt’ oder Paranormal Activity in diesem Herbst in den USA“, so der Ausblick von Henke, der den Film beim Nuance-Fachkongress Conversations DACH vorstellte. Die Präsentation von Henke war wirklich witzig und eindrucksvoll.