Amazing Race: Diktiersoftware Dragon gewinnt gegen die Meisterin im Schnellschreiben

Meisterin im SchnellschreibenSpracherkennung ist nicht nur für Ärzte und Juristen ein heißes Thema. In vielen Berufen muss ein hohes Schreibaufkommen unter Zeitdruck bewältigt werden. „Kein Wunder, dass immer mehr Krankenhäuser und Gerichte nach neuen Wegen suchen. Da ist zunächst der Umstieg auf die Digitaltechnik, die das mühsame Hantieren mit Kassettenbändern ersetzt und zudem den elektronischen Transport der Diktate erlaubt. Dass die Akustik solcher Aufzeichnungen deutlich besser ist, kommt als angenehmer Nebeneffekt hinzu. Der zweite Schritt ist der Übergang zur elektronischen Spracherkennung am PC, wobei in der Regel die Standardsoftware Dragon Naturally Speaking für Windows zum Einsatz kommt. Kein anderes Programm hat eine vergleichbar hohe Erkennungsleistung“, schreibt beispielsweise Michael Spehr von der FAZ.

Wozu Maschinen schon jetzt in der Lage sind, stellte ein Amazing Race am 11. November 2009 in München auf dem Fachkongress Conversations DACH unter Beweis. In einem Mensch-gegen-Maschine-Wettkampf trat Martina Wichers, Deutsche Meisterin im Schnellschreiben, gegen das Spracherkennungssystem Dragon Naturally Speaking von Nuance an. Frau Wichers war unheimlich schnell. Das beweist mein Mitschnitt. Die Software brauchte allerdings nur die Hälfte der Zeit. Hier der Film.
Foto Amazing Race

Last Call – Horror per Handy: Werbeagentur Jung von Matt konzipiert sprachgesteuerten Kinofilm

Spracherkennung und die Sprachsteuerung von Geräten oder Suchmaschinen sind schon längst keine Zukunftsmusik mehr. Vor allen Dingen im Mobilfunk setzt man auf neue Steuerungsmöglichkeiten und Applikationen. „Wer die schlauesten Handy-Anwendungen anbietet, wird den Mobilfunkmarkt der Zukunft beherrschen“, berichtet beispielsweise Spiegel Online. „Stellen Sie sich eine Handy-Anwendung vor, die über einen Tastsensor Ihren Stresslevel misst und die zu ihrem Gemütszustand passende Musik abspielt. Dass Sie die Nummer des Notrufs wählen und ein Arzt, der sich zufällig in einem benachbarten Gebäude aufhält, automatisch darüber informiert wird. Oder dass Sie Ihr Smartphone in der Stadt auf Gebäude richten und das Telefon ihnen anzeigt, wie ihre Umgebung vor 50 oder 100 Jahren ausgesehen haben dürfte“, so Spiegel Online.

Augmented Reality, erweiterte Realität, heiße das Schlagwort für solche Tech-Visionen, die Wissenschaftlern zufolge in den kommenden Jahren die Mobilfunkbranche durcheinanderwirbeln könnten. Es gehe um Bilder und Videos, um Informationsschilder und Töne, die das Smartphone dem Nutzer an Ort und Stelle aus dem Internet saugt und auf dem Display mit dem Abbild der Wirklichkeit kombiniert. Das Handy werde so zu einer Art Sinneserweiterung. Was man mit Sprachsteuerung schon heute mit Handys veranstalten kann, beweist der interaktive Horrorfilm „Last Call“ von der Werbeagentur Jung von Matt. Hier können Kinobesucher aktiv ins Geschehen eingreifen. „Wir wollen zwei Grenzen aufheben: die eine zwischen Film und Game, die andere zwischen Handlung und Zuschauer“, erklärt Andreas Henke, Creative Director von Jung von Matt, im Interview mit NeueNachricht.

Die strikte Trennung von Leinwand und Handlung soll gesprengt werden. „Hier der passive Zuschauer hinter seinem riesigen Popcorn-Becher. Vielleicht sollte man den Erfolg unseres Films an der Zahl ungewollt umgestoßener Popcorn-Becher messen“, sagt Henke. Seine Agentur möchte dem Kunden 13th Street und den Zuschauern ein innovatives Markenerlebnis bieten: „Kurz gesagt: guten modernen Horror. Gerade das Horrorgenre hat in der Vergangenheit sehr innovative Projekte geliefert. Wie vor einigen Jahren ‚Blair Witch Projekt’ oder Paranormal Activity in diesem Herbst in den USA“, so der Ausblick von Henke, der den Film beim Nuance-Fachkongress Conversations DACH vorstellte. Die Präsentation von Henke war wirklich witzig und eindrucksvoll.

Was Sprachcomputer noch leisten werden – O-Töne von Professor Wahlster sind sehr interessant

DSC_0102

Über die Voice Days plus habe ich ja schon einiges berichtet. Interessant sind noch die Ausführungen von Professor Wahlster vom Deutschen Forschungszentrum für künstliche Intelligenz (DFKI) zu den sprachgesteuerten Diensten. Hier die O-Töne der Pressekonferenz. Am Anfang reden die beiden Vertreter der Nürnberg-Messe, dann Voice Days plus-Sprecher Bernhard Steimel und am Schluss dann Professor Wahlster.

Sind Sprachcomputer Schrott? Eure Erfahrungen interessieren mich!

Ich habe einen längeren Artikel über die Voice Days plus geschrieben direkt nach der Pressekonferenz der Veranstalter.
Bei dieser Fachkonferenz werden ja jedes Jahr die besten Sprachdialogsysteme im telefonischen Kundenservice ausgezeichnet. Ob die ausgezeichneten Anwendungen wirklich gut sind, konnte ich während des Pressegesprächs nicht testen. Der Jury-Vorsitzende Professor Wahlster vom DFKI jedenfalls äußerte sich kritisch. So ist jede zweite Sprachapplikation wohl totaler Schrott, da die Technologien teilweise zehn Jahr oder mehr auf dem Buckel haben.
Auf dem Blogjournalisten-Portal gab es zu meinen Ausführungen dann noch einen kritischen Kommentar eines Betroffenen:

„a) Telekom. Ja, das Ding mag der Telekom Mühe ersparen. Es verstand meine Nummer aber auch auf 5 Anläufe nicht. Ich kam mir vor wie bei Professor Hase. Daß man die Nummer auch eintippen kann, sagt es einem nicht. Wenn cih das nicht gemacht hätte, wär mein Telefon jetzt noch gestört, denn man kommt an diesen maschinen nicht vorbei.

b) Apothekenfinder: „FÜRN ARSCH EY!“.

Sorry, muß ich so direkt sagen.

Wir waren in der Klinik, hatten ein Rezept bekommen. Offene Apotheken gäbe es in X, Y und Z. Man könne aber nicht sagen, welche. Es gab nur diese 01805-Nummer des ärtzlichen Notdienstes, der aber vom Handy aus scheißteuer ist.

Na gut, fuhren wir halt in Y die Hauptstraße auf und ab, bis eine Apotheke in Sicht kommt. Da wird dann schon dranstehen, welche die ist, die Notdienst macht.

Denkste! Da hing ein leuchtroter Zettel mit der 22833 dran! :-(((

Wenn man da anruft, wird man erstmal 30 Sekunden gebührenpflichtig zugeplappert, was das doch für ein toller Service ist. Und dann muß man den Ort sprechen.

Ist „Seefeld“ so schwer zu verstehen?!?!?

Jedenfalls ging es nicht.

ich sollte dann die Postleitzahl eintippen.

Die stand aber an der ganzen Apotheke nirgends und woher soll ich die Postleitzahl eines mir unbekannten Ortes wissen? Muß man jetzt auch noch das Postleitzahlenbuch mit sich haben im Auto? Oder mit einem zweiten Handy einen Postleitzahlendienst anrufen? und versteht der dann „Seefeld“?

Am Schluß sind wir in Seefeld nochmal in die Klinik, die hatten dort eine Liste aller Apotheken, die habe wir dann mit dem Navi abgefahren und auch die offene gefunden.

Dafür hat mir 22833 eine komische SMS mit kryptischem Code geschickt – und die Rechnung kommt sicher auch bald. Aber sowas von untauglich! Warum können die Leute nicht wie früher an die Apotheke dranhängen, welche Notdienst hat? Bekommen die Provisionen von 22833? Und was machen Leute ohne Handy?“. Ende des Kommentars.

Den Dienst 22833 habe ich jetzt selbst getestet für Bonn-Duisdorf. Ergebnis war zufriedenstellend. Der Ansagetext nervt. Die Sache mit der Postleitzahl ist idiotisch, wenn man ortsfremd ist – auch richtig. Der Preis pro Minute liegt deutlich zu hoch, da wird besonders bei Mobilfunkdiensten zugeschlagen – ärgerlich. Und prinzipiell bieten die telefonischen Dienste, egal ob es sich um Automaten oder Menschen handelt, einen miserablen Kundenservice – von den aggressiven Call Center-Attacken bis zum Bürgertelefon 115. Auch das hat Wahlster bemängelt. Zu wenig Investitionen, kein Thema im Top-Management zu wenig Neuinvestitionen. Und es ist doch für uns Verbraucher mittlerweile sehr komfortabel, unsere “Kundenerfahrungen” über das Social Web zu kommunizieren und den Unternehmen Dampf unter dem Hintern zu machen. Eure Erfahrungen mit den telefonischen Services für Kunden interessieren mich. Nur wenn die Anbieter mit den realen Erlebnissen der Verbraucher konfrontiert werden, wird sich etwas verändern!

Das Microsoft-Auto – Fahrkomfort durch Internet-Dienste und Sprachsteuerung

C-Kl. Elegance_Cockpit_04Sowohl Microsoft als auch Open-Source-Initiativen sehen ein großes Potenzial für den Einsatz von Internet-Software in Autos. Ein System von Microsoft und Fiat soll nach einem ORF-Bericht den Nutzern dabei helfen, ihren Fahrstil umweltfreundlicher zu machen. „In den USA hockt schon ein virtueller Versicherungsagent mit im Bordcomputer, der risikoreiches Fahren mit höheren Prämien bestraft“, so der Fernsehsender ORF. „Microsoft bringt webbasierte Dienste ins Auto“, kündigte Microsoft-Manager Tom Philipps im Gespräch mit ORF.at an. Seit etwa zehn Jahren spiele Software im Auto eine zunehmend wichtigere Rolle. Microsoft möchte Autoanwendungen um Internet-Dienste erweitern. Philipps bezeichnet das Auto als „Aktivitätsinsel“, da es bisher nicht ins Internet integriert war. Ein Beispiel für die Verschränkung von Fahrzeug und Web sei das eco-Drive-Programm, das der italienische Autohersteller Fiat auf Basis der Software-Plattform „Microsoft Auto“ entwickelte. Hier die komplette Meldung.