Sprachsteuerung als Dialogmanager für mobile Geräte

Die Kommunikation zwischen Mensch und Maschine wird nach Expertenmeinung vor allen Dingen durch die mobile Spracherkennung vorangetrieben. So geht Datamonitor in der Studie „The Proliferation of Innovative Speech Applications in Mobile Computing“ davon aus, dass sich die Sprachsteuerung von Handsets in den kommenden fünf Jahren verdreifacht: von 32,7 Millionen US-Dollar auf 99,6 Millionen US-Dollar. In Fahrzeugen geht man von einer Steigerung von 64,3 Millionen auf 208,2 Millionen aus. Als wichtigen Wachstumsfaktor sieht das CIO-Magazin die immer besseren Netzwerke, die zu neuen Wegen bei der Sprachübertragung führen. „Der Trend scheint zu einer Mischung aus netzwerkbasierter und eingebetteter Sprache zu gehen, mit der man beispielsweise das Menü steuern und eine Internetsuche durchführen kann“, so die Fachzeitschrift. Vor allem bei Arbeitnehmern im Außendienst und in Lagerhallen würde sich die Nützlichkeit der Sprachsteuerung erweisen. Die Datamonitor-Studie berichtet von positiven Erfahrungen von Betreibern von Lagern, deren Mitarbeiter ihre Konzentration dank der mobilen Spracherkennung nicht von Tätigkeiten wie dem Heben von Gegenständen abwenden mussten. Ein Wachstumsmarkt sei auch das Gesundheitswesen und hier vor allem die Altenpflege. Bei gleich bleibenden Budgets müssten immer mehr alte Menschen betreut werden.

Die von der Berliner Firma Aastra-Detewe entwickelte Sprachtechnologie soll Pflegedokumentationen in der stationären Altenhilfe einfacher, schneller und besser machen: „So ist eine Nachtschwester für viele Bereiche und Bewohner zuständig und kann nicht alle Akten ständig bei sich tragen. Die Spracherfassung über das mobile Telefon vereinfacht die Dokumentation, sichert die Qualität und spart nebenbei noch Zeit“, erklärt Andreas Latzel, Deutschlandchef der Aastra-Gruppe. Aastra-DeTeWe kombiniere interaktive Anwendungen auf DECT-Mobiltelefonen mit einem speziell von Pflegewissenschaftlern angepassten Sprachportal. So werden alle Eingaben in Echtzeit überprüft und direkt in einer elektronischen Patienten-Akte abgelegt. Bei einem Pflegeheim mit etwa 100 Mitarbeitern und einer durchschnittlichen Fluktuation setzt Aastra-DeTeWe auf Sprachportale. Bei ihnen können interaktive Sprachdialoge zusammengestellt werden, um automatisiert mittels Sprache zu navigieren.

„Die Prognosen der Marktforscher und Branchenvertreter spiegeln die aktuelle Entwicklungsdynamik wider. Dabei zeichnen sich drei Trends ab, die getrennt zu betrachten sind. Erstens ist die Endgeräte-Bedienung per Sprachbefehl im Auto stark im Kommen und wird die Akzeptanz von Spracherkennung in vielen anderen Anwendungsgebieten positiv beeinflussen. So bietet Navigon die Spracheingabe von Navigationszielen mit einem Satz in ihren Highend-Versionen ihrer Navigationssysteme an. Die großen Autokonzerne werden hier nachziehen“, erklärt Bernhard Steimel, Sprecher der Voice Days plus. Allerdings könne es noch zwei bis drei Jahre dauern, bis die Technik für alle Fahrzeugklassen verfügbar ist. „Zweitens gibt es vielversprechende Ansätze, Sprachsteuerung bei Smart Phones im Zusammenspiel mit anderen Eingabe- und Ausgabemodi einzusetzen. Ein gutes Beispiel ist die mobile Internetsuche ‚Google Mobile App’ für das iPhone. Innovationsmotor ist hier die rasant wachsende Entwickler-Community für den App Store von Apple“, so Steimel.

Als dritten Faktor sieht er die intelligente Verknüpfung von mobilen Applikationen und Sprachcomputern im Call Center-Umfeld. „Das Handy wird hier zu einem Serviceterminal, wo man ähnlich wie am Bankautomat seinen Kontostand abfragt oder eine Buchung vornimmt. Bei komplexeren Transaktionen kann jederzeit eine Telefon-Verbindung mit einem Service-Mitarbeiter aufgebaut werden; das intelligente Sprachsysteme übergibt alle Eingaben an dessen Arbeitsplatz“, erläutert Steimel. Auf den Voice Days plus in Nürnberg werden T-Mobile und Vodafone erste Prototypen im Praxisforum „Mobile Service“ am 7. Oktober vorstellen.

Dialogmanagement-System
Dialogmanagement-System
Bei der Sprachsteuerung für die mobile Internetnutzung steckt man allerdings noch in den Kinderschuhen. Das gilt vor allen Dingen für die entsprechenden Dienste der Suchmaschinenanbieter. Ein intelligentes Dialogmagement ist noch nicht möglich, um wirklich von virtuellen und persönlichen Assistenten zu sprechen: „Der Dialog-Manager agiert als zentrale Stelle im System, interpretiert jede Anfrage und leitet diese zur Verarbeitung an die übrigen Module weiter. Er entscheidet, ob und wie eine Frage gestellt wird und wie eingehende Fragen beantwortet werden. Diese auf Künstlicher Intelligenz beruhende Komponente enthält dynamische Strategien, die abhängig von der jeweiligen Situation aufgerufen werden können“, erklärt Lupo Pape, Geschäftsführer von SemanticEdge in Berlin. So könne man einen Flug nach London buchen, dann nach den Temperaturen fragen und nach Erhalt der Antwort sich wieder der Flugbuchung zuwenden. Regelbasierte und heuristische „wenn….dann“-Abfragen machten es möglich, dem Kunden auch komplexe Informationen mitzuteilen: „Für den angegebenen Preis stehen nur zwei Drucker zur Verfügung, aber für einen Aufpreis von nur 50 Euro kann ich Ihnen vier weitere Drucker anbieten, die schneller und besser sind“.

Spracherkennung als Bürokratiekiller im Gesundheitswesen

Sie produzieren Berge von Bürokratie – so lautet einer der häufigsten Kritikpunkte an modernen Gesundheitssystemen in aller Welt. „Doch gegen Bürokratie lässt sich etwas unternehmen: Kliniken, die bei der Erstellung von Dokumenten auf digitales Diktat und Spracherkennung setzen, beschleunigen damit das Anfertigen von Arztbriefen und Befunden“, berichtet der Fachdienst HealthTech Wire.

Sie würden das medizinische Personal entlasten, die Patientensicherheit erhöhen und die einrichtungsübergreifende Vernetzung voranbringen. „Aktuelle Daten dazu liefert zum Beispiel Javier Quiles del Rio, IT-Leiter des Gesundheitsdienstes in der spanischen Region Galizien. Dort werden derzeit alle 14 öffentlichen Krankenhäuser mit Spracherkennung ausgestattet“, so HealthTech Wire. „In einem Krankenhaus mit 1.200 Betten hat sich durch die Spracherkennung die Zeit bis zur Erstellung eines endgültigen radiologischen Befundes von knapp zwei Tagen auf einen halben Tag reduziert“, erläutert Quiles del Rio.

Die Vorteile einer automatisierten Dokumentation bestätigt der Radiologe Dr. Robert Kierse vom Institut für Röntgendiagnostik und Nuklearmedizin am Klinikum Neuperlach: „Der ganze Prozess der Dokumentenerstellung mit Diktat auf Band, Transkription im Schreibbüro oder Korrektur konnte von sieben Schritten auf nur drei Schritte reduziert werden“, so Kierse gegenüber dem CIO-Magazin. Auf diese Weise werden nicht nur Kosten gespart, der Patient könne durch die beschleunigte Erstellung des Befundes auch schneller behandelt werden. Mittlerweile werden in Neuperlach 90 Prozent aller radiologischen Dokumente mit Online-Spracherkennung erstellt, die übrigen zehn Prozent mit Offline-Spracherkennung.

Das intelligente Heim - Projekte des Bundesfamilienministeirums
Das intelligente Heim - Projekte des Bundesfamilienministeriums
Auch das Pflegeheim „Im Münchfeld“ des Arbeiter Samariter Bundes (ASB) in Mainz sammelte positive Erfahrungen in einem Pilotprojekt. Über eine intelligente Vernetzung von Hard- und Software sollen die Pflegeprozesse optimiert werden. Das umfasst die Software OPAS Sozial und moderne Spracherkennungstechnologien. Die technische Basis der in diesem Pilotprojekt entwickelten Lösung, die mittels Telefon und Sprache eine strukturierte und zugleich individuelle Dokumentation der Pflege ermöglicht, bildet eine modulare, integrierte Informations- und Telekommunikations-Plattform von Aastra-DeTeWe. Sie umfasst einen Kommunikations-Server sowie die neuesten Versionen der Kommunikationslösungen für stationäre Pflege und Betreutes Wohnen: Aastra Voice Portal für die Spracherkennung und die OPAS Sozial Software-Lösung für die stationäre Pflege.

Die Dokumentation mittels Spracherkennung erfolgt häufig im Bewohnerzimmer oder direkt im Anschluss an die Pflegeleistung. Der Anteil des Pflegepersonals, der so vorgeht, ist deutlich gestiegen. So geben knapp 90 Prozent zu Protokoll, dass die Lösung leicht bedienbar sei und rund 80 Prozent der Umfrageteilnehmer ziehen die EDV-gestützte Pflegedokumentation mit OPAS Sozial einer Papierbasierten Dokumentation vor.

Zusätzlich hierzu wurde in einem Überwachungsaudit der Einrichtung im Münchfeld von 2008 zur Zertifizierung nach DIN ISO 9001:2000 von den Auditoren festgehalten, dass die im Rahmen des Modellprojekts modifzierte Pflegedokumentation einen nachvollziehbaren Fortschritt im Hinblick auf Vereinfachung, Zeitersparnis und Erhöhrung der Zuverlässigkeit in der Dokumentation darstellt. Die digitale Sprachverarbeitung und insbesondere die Spracherkennung könnten auch dazu beitragen, Kliniken den Umstieg von der Papierdokumentation auf elektronische Patientenakten zu erleichtern.

„Im Zusammenhang mit elektronischen Patientenakten ist Spracherkennung für mich ein strategisches Werkzeug. Spracherkennung hilft uns dabei, die Digitalisierung umzusetzen, weil es ein schnelles und einfaches Verfahren ist, elektronische Dokumente zu erstellen“, betont Quiles del Rio. Auch hier hat er Zahlen aus Spanien parat: In radiologischen Abteilungen mit Spracherkennung liegt die Quote der Befunde, die elektronisch verfügbar gemacht werden, bei mehr als 90 Prozent. Einrichtungen ohne Spracherkennung kommen nur auf die Hälfte.

Die Rolle der Kommunikationstechnologie für den Aufschwung

Nach einer Studie des DIW sollte die Bundesregierung ihr Konjunkturprogramm stärker auf das Bildungswesen, die Energieeffizienz, Gesundheitsförderung und den Ausbau der Internet-Infrastruktur ausrichten, beispielsweise durch eine flächendeckende Breitbandversorgung . Hier habe Deutschland im internationalen Vergleich einen hohen Nachholbedarf. Im Bildungssektor sollten 4,4 Milliarden Euro gezielt in die Verbesserung der Lehrmittelausstattung investiert werden.
aastra1Konjunkturprogramme sollen die Auswirkungen der Finanzkrise eindämmen. Damit die Milliardensummen nicht verpuffen, müsse nachhaltig investiert werden.

Latzel im Interview mit dem Deutschlandfunk
Latzel im Interview mit dem Deutschlandfunk

Andreas Latzel, Deutschland-Chef der Aastra-DeTeWe-Gruppe, lobte im Interview mit dem Deutschlandfunk die Investitionen der Bundesregierung in die Kommunikationsinfrastruktur. Als Beispiel nannte er ein Projekt des Bundesfamilienministeriums. Dabei geht es um das Thema Altenpflege und insbesondere darum, was Technik in der Altenpflege bewirken könne. „Das Projekte hat den Namen ‚Das intelligente Heim’ und verfolgt den Ansatz, einfach übergreifend zu schauen, an welchen Stellen wirklich nachhaltig auch mit dem Einsatz von Technologie die Pflege verbessert werden kann. Wir haben daran teilgenommen und haben eine Lösung vorgestellt, die das Thema Pflegedokumentationen im Schwerpunkt hat. Und ich glaube, die meisten Menschen wissen, dass Qualität in der Pflege – das ist ja auch in der Vergangenheit öfters durch die Presse gegangen – inzwischen eine ganz, ganz wichtige Rolle spielt“, sagte Latzel.

In der Pflegedokumentation habe man bislang viel mit Papier gearbeitet. „Wenn man dann weiß, dass die Personalressourcen in der Altenpflege natürlich auch knapp bemessen sind, dann ist ein Großteil der Arbeitszeit auch für das Dokumentieren von erbrachten Leistungen verwendet worden. Und hier ganz speziell hat Aastra einen Weg beschrieben, der den Einsatz von Kommunikationstechnologie, insbesondere auch das Thema Sprache, nutzbar macht, um viel Zeit zu sparen und damit letzten Endes mehr Zeit für die Pflege der Menschen zu haben“, so Latzel.

Generell werde seine Branche gebraucht, um Menschen umfassend und frühzeitig mit Kommunikationstechnologie zu versorgen. „Wir arbeiten sehr eng mit einigen Hochschulen zusammen, wo übergreifendes Wissen dann letzten Endes auch in der Praxis abrufbar ist. Ich denke da zum Beispiel an die Hochschule der Künste in Berlin, wo auch wirklich Menschen umfassend sowohl das Thema Technologie als auch das Thema Design oder Anwendungsorientierung mitnehmen und daraus ganz neue mögliche Arbeitsgebiete entstehen“, so Latzel gegenüber dem Deutschlandfunk.

Nach Analysen des DIW habe Deutschland die besten Chancen, gestärkt aus der Krise hervorzugehen. In keinem anderen Land sei der Anteil der Wertschöpfung, der auf die Produktion forschungsintensiver Güter und wissensintensiver Dienstleistungen entfällt, höher als in Deutschland. Dabei würde Deutschland in den forschungs- und wissensintensiven Wirtschaftsbereichen eine besonders breit gefächerte Basis besitzen. „Voraussetzung für einen Ausbau der Spitzenposition ist jedoch, dass die Unternehmen unvermindert weiterhin in Forschung und Entwicklung investieren – auch dann, wenn damit kurzfristig keine Erlöse zu erzielen sind“, so der DIW-Wissenschaftler Martin Gornig.

Sprachtechnologie: Künstlich und intelligent? Auf jeden Fall smart und nützlich für Autoverkehr, Gesundheitswesen und mobile Kommunikation

Ob Sprachtechnologie schon zur Künstlichen Intelligenz gerechnet werden kann, ist unter Experten umstritten. Die Einordnung von sprachgesteuerten Geräten in intelligent oder „nur“ smart, ist nach Auffassung von Voice Days-Sprecher Bernhard Steimel zweitrangig. „Entscheidend ist der Nutzen. Und hier kann man interessante Anwendungsfelder ausmachen, etwa bei der Montage von Flugzeugen, in der Logistik, im Gesundheitswesen oder im Autoverkehr“, sagt Steimel.

„Sprachsteuerung macht das Autofahren sicherer“, berichtet das Handelsblatt. Wenn ein Fahrer sich ein neues Ziel überlegt, soll er künftig das Navi nicht mehr per Hand neu programmieren, sondern dies per Sprache erledigen. „Das ist nicht nur einfacher, sondern reduziert auch die Unfallgefahr, wie Studien belegen. Erste Geräte sind auf dem Markt. Zunächst sind zwar nur teure Modelle mit der Sprachsteuerung ausgestattet, doch es wird nicht lange dauern, dann werden alle Geräte per Zuruf funktionieren“, so das Handelsblatt. Das Geschäft mit der Sprachsteuerung sei den Kinderschuhen entwachsen. Die Technik habe einen Reifegrad erreicht, dass auch immer mehr Handyhersteller sprachgesteuerte Bedienmenüs einsetzen. „Mobile Geräte mausern sich so langsam zu persönliche Assistenten für Beruf und Freizeit. Die Hardware und auch die dafür nötige Energieversorgung machen gewaltige Entwicklungssprünge, so dass man in nächster Zeit einige Überraschungen erleben und neue intuitive Interaktionsmöglichkeiten finden wird“, prognostiziert Steimel. Neben dem Marktführer Nuance basteln Microsoft, Yahoo und Google an Programmen, um das mobile Internet zu erobern.

Aastra-DeTeWe sieht das Gesundheitswesen als interessantes Betätigungsfeld. Die von der Berliner Firma entwickelte Technik soll Pflegedokumentationen in der stationären Altenhilfe einfacher, schneller und besser machen: „So ist eine Nachtschwester für viele Bereiche und Bewohner zuständig und kann nicht alle Akten ständig bei sich tragen. Die Spracherfassung über das mobile Telefon vereinfacht die Dokumentation, sichert die Qualität und spart nebenbei noch Zeit“, erklärt Andreas Latzel, Deutschlandchef der Aastra-Gruppe. Bei einem Pflegeheim mit etwa 100 Mitarbeitern und einer durchschnittlichen Fluktuation setzt Aastra-DeTeWe auf Sprachportale. Bei ihnen können interaktive Sprachdialoge zusammengestellt werden, um automatisiert mittels Sprache zu navigieren. „Die Sprache wird dabei nicht völlig frei per Umsetzung von Sprache in Befehle erkannt, sondern mit Hilfe einer vorher festgelegten Grammatik“, sagt Latzel. Wichtige Erfahrungen mit dem Pflegedokumentationsprogramm OPAS Sozial wurden in dem vom Bundesministerium für Familie, Senioren, Frauen und Jugend geförderten Pilotprojekt „Das intelligente Heim“ gesammelt und von Pflegewissenschaftlern ausgewertet. Bericht kann hier heruntergeladen werden.

Laut Opus Research hatte der Markt für Spracherkennung 2007 ein Volumen von 1,6 Mrd. Dollar. In den nächsten drei Jahren soll er laut dem Marktforschungsunternehmen jährlich um 14,5 Prozent wachsen. „Kein Wunder, dass nun immer mehr Firmen auf die Spracherkennungstechnik setzen“, resümiert das Handelsblatt. Der Markterfolg von sprachgesteuerten Navigationsgeräten und Handys werde auch die Systeme im telefonischen Selbstbedienungsservice beflügeln und das Image der Call Center-Branche verbessern. Davon ist der Sprachdialogexperte Bernhard Steimel überzeugt.

Virtuelles Fräulein vom Amt – Sprachgesteuerte Handys als Tipping Point des Internets

Die Sprachsteuerung des iPhones mit „Google Mobile App“ http://googlemobile.blogspot.com wird von Web 2.0-Pionier Tim O’Reilly als „Tipping Point“ gewertet: Der Begriff  bezeichnet jenen Moment, in dem etwas Einzigartiges zum Normalzustand wird und einen qualitativen Umschlagspunkt markiert. „Es ist es an der Zeit, Telefone als erstklassige Geräte zu sehen, um auf das Internet zugreifen zu können, und nicht nur als Möglichkeit, Inhalte und Anwendungen umzuwidmen, die ursprünglich dazu gedacht waren, mit einer Tastatur und einem Bildschirm gelesen zu werden“, schreibt O’Reilly in seinem Blog http://radar.oreilly.com. Mit der Sprachsteuerungsfunktion werde ein neuer Weg für Computerdienstleistungen beschritten. „Apple begeisterte uns mit dem iPhone-Touchscreen, aber die Einbeziehung des Beschleunigungsmessers war fast ebenso wichtig; und jetzt hat Google uns gezeigt, wie dieser als Hauptkomponente einer Benutzeroberflächenanwendung eingesetzt werden kann. Legen Sie das Telefon ans Ohr und die Anwendung fängt an mitzuhören; eher durch eine natürliche Geste als durch ein künstliches Klopfen oder Klicken ausgelöst. Ja, der Beschleunigungsmesser wurde bereits in Spielen wie tilt oder the iPint verwendet, aber Google hat das Ganze noch etwas weiter getrieben durch die Integration des Telefon-Hauptsensors: das Mikrofon“, so O’Reilly. Nach seiner Ansicht liegt hier die Zukunft von Mobiltelefonen: eine Benutzeroberfläche zu entwickeln, die alle bisherigen Generationen über Bord wirft. Zeigen und klicken war ein Durchbruch für Computer, aber eine Sackgasse für das Design von Benutzeroberflächen.  

Mittlerweile haben das iPhone und ähnliche Smartphones eine Vielzahl an Sensoren: Mikrofon, Kamera, Touchscreen, Beschleunigungsmesser, und Standortortung. Neue Anwendungen und Kombinationen werden zu weiteren Überraschungen führen. „Künftige Geräte werden eine immer größere Anzahl an Sinnen haben, um darauf zu achten, was wir wollen. Könnte ein Telefon die Bewegung erkennen, die wir machen, wenn wir eine Kamera vor uns hochhalten, damit wir die Einstellungen festlegen können? Könnten wir mit dem Telefon reden um Kameraeinstellungen zu verändern? Könnte ein Telefon automatisch die Bewegung eines Autos erkennen und auf Sprachwahl umstellen? Und dann gibt es natürlich noch alle weitere Interaktionen mit anderen Geräten die möglich sind, wenn wir das Telefon als Steuerteil betrachten – ähnlich der Wii-Konsole von Nintendo“, erklärt O’Reilly. 

Auch in der ITK-Branche erwartet man Impulse über die Sprachsteuerung: „Computer werden heute immer noch primär über eine Tastatur bedient, die aus der Schreibmaschine entstanden ist, so als ob jeder Tastendruck einen mechanischen Hebel in Bewegung setzt. Selbst der Zeilenvorschub und Wagenrücklauf alias Carriage return ist uns erhalten geblieben, obwohl damit schon lange kein Papier mehr transportiert wird. Telefone haben zwar die Revolution von der Wählscheibe hin zur – in der Regel – 3×4 Tastatur gemacht, standardisiert nach ITU E.161, das erfolgte aber bereits in den 70er Jahren. Selbst moderne Handys und Smartphones halten sich noch an den Tastenwahlblock, entweder in mechanischer Ausführung oder als Icon-Darstellung auf einem Touchscreen“, weiß Andreas Latzel, Deutschland-Chef des ITK-Spezialisten Aastra http://www.aastra.de, der viel Wert auf die Benutzerfreundlichkeit seiner Systeme legt. Die Technikentwicklung sei zwar rasant schnell und ein gutes User-Interface inzwischen intelligent sowie kontextbezogen – im Kern aber immer noch traditionell. Vorhersehbar sei, dass der Tastaturblock an seine Grenzen stoße – spätestens mit der breiten Einführung der SIP-Telefonie und der SIP-Teilnehmeradressen.

„Anders als bei professionellen Tischgeräten kommt die Ausstattung von Handys mit alphanumerischen Tastaturen zwar auch vor, ist aber in der Regel wegen der beschränkten Abmessungen nicht befriedigend. Da bietet sich der Weg zum Sprachinterface an: der Ansage von Adressen oder Einträgen des Telefonbuchs in normaler Sprachform. Sinnvoll ist das beim Autofahren oder anderen Tätigkeiten, die beide Hände verlangen. Ein gutes Beispiel im professionellen Umfeld ist die Pflege in Altenheimen mit der Aastra-Branchenlösung OPAS. Hier kann beispielsweise mittels Telefon und Sprache die erbrachte Leistung dokumentiert werden – das Pflegepersonal gewinnt viel mehr Zeit für die Bewohner“, sagt Latzel. Übrigens schlage die Technik mit der Sprachwahl den Bogen zurück zu den Anfängen des Telefons vor der Einführung des Selbstwählsystems: damals aktivierte man den Telefonapparat durch Erzeugung einer Rufspannung über den Kurbelinduktor und sagte dem „Fräulein vom Amt“, mit welchem Teilnehmer man sprechen möchte. „Im modernen Telefon mit Sprachinteraktion wird das Fräulein von einer Software ersetzt“, so Latzel. In Kombination mit den Datenwolken von Google ergeben sich nach Prognosen von O’Reilly ungeahnte Möglichkeiten. „Sensorenreiche Geräte mit Anwendungen, die diese Sensoren nutzen, um mit Datenwolkendiensten zu interagieren und sie zu füttern. Der Standortsensor weiß, wo man sich befindet; das Mikrofon erkennt den Klang der Stimme, so dass es persönliche Daten in der Datenwolke frei setzt; die Kamera nimmt Objekte und Personen auf und sendet ein Bild zu einer abgelegenen Anwendung, die diese erkennt und die entsprechenden Informationen abruft“, führt O’Reilly aus. Viele Durchbrüche würden bereits vor der Tür stehen. Die Stimmen- und Gestenerkennung in der Google Mobile-Anwendung seien nur der Anfang. Der gleichen Meinung ist der Berliner Sprachdialogexperte Lupo Pape: „Es ist erst einmal eine Sprach- oder Diktiererkennung, die auf einer Suchmaschine und demnächst sogar auf weiteren Handyfunktionen aufsetzt. Sprachdialogsysteme werden es erst, wenn ein Wissen über die Domäne und Dialogintelligenz hinzukommen. Das ist das, was wir mit dem Personal Assistant umsetzen. Dazu müssen die Wissensgebiete semantisch aufbereitet und Dialogstrategien hinterlegt werden. Die wichtigsten Use-Cases gilt es zu modellieren“, resümiert SemanticEdge-Geschäftsführer Pape.

 

Siehe auch:

http://de.youtube.com/watch?v=y3z7Tw1K17A&eurl=http://googlemobile.blogspot.com/

http://googleblog.blogspot.com/2008/11/now-you-can-speak-to-google-mobile-app.html