Im Kampf gegen nervige Call Center-Anrufe braucht man bessere Gesetze – Die bisherigen Entwürfe der Regierung bringen nichts!

Zur Branchenmesse Call Center World, die in dieser Woche wieder traditionell in Berlin stattfindet, sind sich alle Experten einig, dass unseriösen Call Center-Firmen endlich der Saft abgedreht werden muss. Allerdings zweifeln viele daran, dass die von der Bundesregierung vorgelegten Gesetzesänderungen der Praxis standhalten. Der Entwurf sieht unter anderem vor, dass den Verbrauchern in allen problematischen Fällen ein Widerrufsrecht zusteht. Zudem müssen Unternehmen zukünftig mit einer Geldbuße rechnen, wenn sie unerlaubt zu Werbezwecken anrufen oder bei Werbeanrufen ihre Rufnummer unterdrücken. Meinungsverschiedenheiten zwischen Politik, Wirtschaft und Verbänden bestehen in der Frage, ob eine Vertragserklärung, die ein Verbraucher bei einem unerlaubten Werbetelefonat abgegeben hat, erst dann wirksam werden soll, wenn der Verbraucher sie innerhalb von zwei Wochen in Textform bestätigt: „Das ist die so genannte Bestätigungslösung. Sie mag zwar auf den ersten Blick für die Verbraucher vorteilhaft erscheinen, ist jedoch bei genauem Hinsehen mit einer Vielzahl von Problemen verbunden. So wäre bei Einführung der Bestätigungslösung zu befürchten, dass die Belästigung durch unerwünschte Telefonanrufe nicht abnähme, sondern zunähme. Denn es muss damit gerechnet werden, dass gerade unseriöse Unternehmer den Verbraucher telefonisch zur Abgabe der Bestätigung drängen würden. Zudem besteht die Gefahr, dass Unternehmen bei Einführung der Bestätigungslösung generell dazu übergehen könnten, für telefonisch geschlossene Verträge sicherheitshalber schriftliche Bestätigungen zu verlangen“, erläutert Dr. Thorsten Bauer, Pressesprecher des Bundesjustizministerium.

Eine Bestätigung in Schriftform hält Call Center-Fachmann Jens Klemann von der Unternehmensberatung Strateco für kontraproduktiv: „Man stelle sich diesen Prozess für zeitkritische Geschäfte vor – ist es nicht gerade oft die telefonische Bestellung mit einem 24 Stunden Lieferservice, die für Verbraucher den Mehrwert bringt? Auch die kurzfristige Buchung von Bahn- oder Flugtickets sowie Mietwagen oder ähnliches müsste damit wohl neu überdacht werden. Ob das im Sinne der Verbraucher ist, bleibt zu bezweifeln“, so die Bedenken von Klemann. Das vom Verband VATM vorgeschlagene „Voice Recording“ wird vom Ministeriumssprecher kritisch aufgenommen. Im Einzelfall ermögliche es den Nachweis, ob der Verbraucher eine bestimmte Erklärung am Telefon abgegeben hat. „Es ist jedoch kein geeignetes Instrument, um unerlaubte Telefonwerbung und die mit ihr verbundene Störung der Privatsphäre zu verhindern. Darüber hinaus sind Aufzeichnungen von Telefongesprächen datenschutzrechtlich nur mit ausdrücklicher Einwilligung beider Gesprächspartner zulässig. Wenn ein Angerufener in die Aufzeichnung nicht einwilligt, hat sie zu unterbleiben“, bemerkt Bauer. Das sieht die Wirtschaft anders: „Jeder, der ernsthaft ein Geschäft abschließen möchte, ist der Gesprächsaufzeichnung gegenüber meistens positiv eingestellt, denn schließlich dient sie der eigenen Sicherheit. Im Bankenumfeld und dort, wo hohe Transaktionsvolumen telefonisch abgeschlossen werden, hat sich dieses Verfahren ja auch seit Jahren bewährt – und wird meist schon im Rahmen der AGB gleich mitbestätigt“, weiß Klemann.Schwierigkeiten erwartet die Call Center-Branche bei der Vollzugspraxis. Nicht so das Justizministerium: „Ein Verstoß gegen das Verbot der Rufnummernunterdrückung soll mit einer Geldbuße bis zu 10 000 Euro bewehrt werden. Wir gehen daher davon aus, dass diese Regelung eine abschreckende Wirkung entfalten wird – seriöse Unternehmen werden ihre Rufnummer nicht mehr unterdrücken“, so Bauer.

Die Kenntnis der Telefonnummer des Anrufers werde die Verfolgung unerlaubter Telefonwerbung wesentlich erleichtern. Der Verbraucher könne sich entweder an eine Verbraucherzentrale oder an die Bundesnetzagentur wenden. „Natürlich wird es sowohl zur Verfolgung der Ordnungswidrigkeit als auch zur Durchsetzung von Unterlassungsansprüchen weiterhin notwendig sein, dass sich der Verbraucher die Umstände und den Inhalt des Telefongesprächs notiert und der zuständigen Stelle schildert. Dafür ist es durchaus sinnvoll, als Verbraucher mit dem Anrufer ins Gespräch zu kommen und Fragen zu stellen: Für wen rufen Sie an? Was ist Ihr Anliegen? Das gilt natürlich in besonderer Weise, wenn die Rufnummer unterdrückt wird“, sagt Bauer. An diesem Punkt kristallisiert sich wahrscheinlich die Schwachstelle des Gesetzesvorhabens heraus. „Die Vorstellungen des Justizministerium sind naiv. Der Verbraucher hat keinerlei Anhaltspunkte, wenn er mit unterdrückter Rufnummer angerufen wird. Und wie aus dem Vorgehen vieler Call Center bekannt ist, unterbrechen viele Agenten das Gespräch, wenn der Angerufene den Namen einfordert. Zwischen theoretischen Trockenübungen und Praxis liegen eben erhebliche Unterschiede: Ist der Verbraucher verpflichtet zu recherchieren, wer ihn angerufen hat? Schließlich wird diese Information benötigt, um den Verstoß auch ahnden zu können. Hier hat die Politik wieder mal einen Gedanken nicht zu Ende gedacht“, kritisiert Bernhard Steimel, Sprecher der Voice Days.

Die Branchengauner zwinge man mit der Gesetzesnovelle nicht in die Knie, prognostiziert Klemann: „Die werden ihr ‚Geschäftsmodell‘ so abändern, dass sie entweder Abmahnungen und Strafen einkalkulieren oder ihren Geschäftssitz und Firmenstruktur so aufsetzen, das man ihnen nicht an die Wäsche kann“, befürchtet der Strateco-Chef. Die härtere Gangart bei der Rufnummernunterdrückung werde den Firmenchefs mit krimineller Energie nur ein müdes Lächeln entlocken. „Es ist aus technischer Sicht ein leichtes – und obendrein schon jetzt gängige Praxis unseriöser Firmen – eine andere Rufnummer als die eigene zu übermitteln. Läge die Beweislast im Falle einer Anzeige durch den Verbraucher beispielsweise beim Call Center selbst, würden alle seriösen Anbieter von sich aus gerne eine umfassende Qualitätssicherung und Dokumentation mit Anrufaufzeichnung einführen“, sagt Klemann. Es könne nicht Aufgabe der Bürger sein, semi-professionelle Recherchen in der Call Center-Landschaft zu betreiben. Gerade ältere Menschen seien damit hoffnungslos überfordert. „Außerdem ist es gängige Praxis, dass aufgelegt wird, sobald der Angerufene detaillierte Angaben zum Unternehmen und zum Agenten haben möchte. Ist dann noch die Rufnummer unterdrückt – wovon in diesem Fall ausgegangen werden kann – ist die Handlungsanweisung des Justizministeriums schlicht und ergreifend absurd“, bemängelt Steimel. Ins Leere gehe auch das Verbot unerlaubter Telefonwerbung für Anrufe, die aus dem Ausland kommen. Im Wettbewerbsrecht gelte zwar das Marktortprinzip. Es besagt, dass immer das Recht des Landes Anwendung findet, an dessen Markt die Leistung bestimmungsgemäß angeboten wird. „Da bekommt der Geschäftsführer einer verschachtelten Konstruktion von verschiedenen Limited-Gesellschaften, die über mehrere Länder verteilt ist, schon heute einen Lachanfall“, resümiert Klemann.

„Sagen Sie ‚Bananen'“: Warum Sprachcomputer Prozesse automatisieren sollten und nicht Menschen – Auf den Spuren von Hofkammerrat Kempelen

Wird über Sprachautomatisierung debattiert, fallen sicherlich jedem Konsumenten sofort eine Reihe nerviger Hotline-Ansagetexte ein, die den Blutdruck in Wallung bringen. Trefflich auf die Spitze getrieben im Werbefilm von Yello Strom am Obststand mit dem roboterhaften Verkäufer und seinem Ansagetext: „Interessieren Sie sich für unsere Bananen, sagen Sie ‚Bananen’……“ Dem Stand der Forschung und dem Ansinnen der Wissenschaftler werden die endlos kolportierten Negativbeispiele nicht gerecht. Schon im 18. Jahrhundert war der Hofkammerrat Wolfgang von Kempelen unter Maria Theresia und Joseph II. davon beseelt, eine Sprechmaschine zu erfinden, die dem Menschen nützt: Der aufklärerisch gesinnte Beamte konstruierte einen Apparat, der gehörlose Menschen zur Lautsprache führen konnte. Die Maschinen-Sprache sollte nicht nur hörbar, sondern vor allem für das Auge verständlich werden. Kempelen äußerte sich optimistisch, „dass die Maschine ohne sonderliche Kunst mit Tasten, wie ein Klavier oder eine Orgel einzurichten wäre, dass Spielen auf derselben, gegen die dermalige Art Jedermann viel leichter fallen würde“, berichtet 1792 das „Magazin für das Neueste aus der Physik und Naturgeschichte“ (Band 8, Seite 101).

Die Idee, dass ein lebendiger Organismus gemäß den Gesetzen von Physik funktioniert und prinzipiell mit Mitteln der Mechanik simuliert werden kann, war spätestens seit dem 17. Jahrhundert nicht länger unklar und verdächtig, sondern wissenschaftliche Hypothese. Die Pionierarbeit von Kempelen wirkte bis ins 20. Jahrhundert: auf Persönlichkeiten wie Charles Babbage, dem „Father of computing“, Homer Dudley, der den Voice Operation Demonstrator (VODER) baute oder auf Mathematiker wie John von Neumann und Norbert Wiener, die sich mit Sprache und Logik beschäftigten. Durch die Sprachsteuerung per Computer ist das Kempelen-Werk sicherlich nicht mehr relevant. „Wissenschaftsgeschichtlich jedoch ist es nach wie vor von Bedeutung, ebenso seine Ansichten und seine philosophische Betrachtungsweise“, erläutert die Kempelen-Expertin Alice Reininger von der Universität für angewandte Kunst in Wien.

Auch heute gehe es nach Ansicht von Andreas Latzel, Deutschlandchef der Aastra-Gruppe, bei der Sprachtechnologie um einen humanitären Ansatz: „Es sollen Prozesse automatisiert werden und nicht Menschen“. Als Beispiel nennt er die Altenpflege. Die von seiner Firma entwickelte Technik soll Pflegedokumentationen in der stationären Altenhilfe einfacher, schneller und besser machen: „So ist eine Nachtschwester für viele Bereiche und Bewohner zuständig und kann nicht alle Akten ständig bei sich tragen. Die Spracherfassung über das mobile Telefon vereinfacht die Dokumentation, sichert die Qualität und spart nebenbei noch Zeit“, sagt Latzel.

Wichtige Erfahrungen mit dem Aastra-Programm OPAS Sozial wurden in dem vom Bundesministerium für Familie, Senioren, Frauen und Jugend geförderten Pilotprojekt „Das intelligente Heim“ gesammelt und von Pflegewissenschaftlern ausgewertet: „Mithilfe der Spracherkennung wird deutlich mehr direkt und zeitnah im Anschluss an die Pflegeleistung dokumentiert. Der Anteil der Personen, die direkt im Anschluss an Maßnahmen dokumentieren, ist von 46 auf 70 Prozent gestiegen. Unter Berücksichtigung des deutlich gestiegenen Dokumentationsvolumens hat die eigentliche Dokumentationszeit abgenommen. So geben über 73 Prozent der Befragten an, bei der Dokumentation mit Spracherkennung deutlich Zeit zu sparen“, so der vorläufige Abschlussbericht.

Über 93 Prozent der beteiligten Mitarbeiter gaben zu Protokoll, dass die Dokumentationsanwendung mit Spracherkennung leicht bedienbar sei. 90 Prozent der Pflegekräfte wollen mit dem Prototyp oder einem ähnlichen System weiterarbeiten. 85 Prozent der Umfrageteilnehmer würden die Dokumentation mittels Spracherkennung anderen Dokumentationsmethoden vorziehen. Eine funktionierende Spracherkennung unterstütze die Dokumentation, so dass zahlreiche Einsatzgebiete der Spracherkennung – weit über die Erstellung des Verlaufsberichts hinaus – denkbar seien. „70 Prozent der Pflegekräfte geben an, dass das Dokumentationsvolumen und die Dokumentationsqualität im Rahmen der Dokumentationsarbeit mit der Spracherkennung deutlich gestiegen sind. Dies wird auch durch die entsprechenden Leiter der Heimträger bestätigt“, so das Fazit der Pflegewissenschaftler. Auf der Call Center World in Berlin wird Aastra branchenspezifische Lösungen vorstellen, unter anderem das multimediale Sprachdialogsystems Aastra Voice Portal 7.5. Nach Firmenangaben versteht es umgangssprachliche Äußerungen ebenso wie komplette Sätze und lässt sich jederzeit unterbrechen. Darüber hinaus werden die Antworten anhand des bisherigen Dialogverlaufs und der jeweiligen Aufgabenstellung generiert. Sind beispielsweise im Kino Filme noch nicht angelaufen oder keine Karten mehr verfügbar, werden Anrufer frühzeitig informiert und müssen sich nicht erst durch die gesamte Dialogstruktur quälen – wie bei menügesteuerten Systemen.

Sprachtechnologie: Künstlich und intelligent? Auf jeden Fall smart und nützlich für Autoverkehr, Gesundheitswesen und mobile Kommunikation

Ob Sprachtechnologie schon zur Künstlichen Intelligenz gerechnet werden kann, ist unter Experten umstritten. Die Einordnung von sprachgesteuerten Geräten in intelligent oder „nur“ smart, ist nach Auffassung von Voice Days-Sprecher Bernhard Steimel zweitrangig. „Entscheidend ist der Nutzen. Und hier kann man interessante Anwendungsfelder ausmachen, etwa bei der Montage von Flugzeugen, in der Logistik, im Gesundheitswesen oder im Autoverkehr“, sagt Steimel.

„Sprachsteuerung macht das Autofahren sicherer“, berichtet das Handelsblatt. Wenn ein Fahrer sich ein neues Ziel überlegt, soll er künftig das Navi nicht mehr per Hand neu programmieren, sondern dies per Sprache erledigen. „Das ist nicht nur einfacher, sondern reduziert auch die Unfallgefahr, wie Studien belegen. Erste Geräte sind auf dem Markt. Zunächst sind zwar nur teure Modelle mit der Sprachsteuerung ausgestattet, doch es wird nicht lange dauern, dann werden alle Geräte per Zuruf funktionieren“, so das Handelsblatt. Das Geschäft mit der Sprachsteuerung sei den Kinderschuhen entwachsen. Die Technik habe einen Reifegrad erreicht, dass auch immer mehr Handyhersteller sprachgesteuerte Bedienmenüs einsetzen. „Mobile Geräte mausern sich so langsam zu persönliche Assistenten für Beruf und Freizeit. Die Hardware und auch die dafür nötige Energieversorgung machen gewaltige Entwicklungssprünge, so dass man in nächster Zeit einige Überraschungen erleben und neue intuitive Interaktionsmöglichkeiten finden wird“, prognostiziert Steimel. Neben dem Marktführer Nuance basteln Microsoft, Yahoo und Google an Programmen, um das mobile Internet zu erobern.

Aastra-DeTeWe sieht das Gesundheitswesen als interessantes Betätigungsfeld. Die von der Berliner Firma entwickelte Technik soll Pflegedokumentationen in der stationären Altenhilfe einfacher, schneller und besser machen: „So ist eine Nachtschwester für viele Bereiche und Bewohner zuständig und kann nicht alle Akten ständig bei sich tragen. Die Spracherfassung über das mobile Telefon vereinfacht die Dokumentation, sichert die Qualität und spart nebenbei noch Zeit“, erklärt Andreas Latzel, Deutschlandchef der Aastra-Gruppe. Bei einem Pflegeheim mit etwa 100 Mitarbeitern und einer durchschnittlichen Fluktuation setzt Aastra-DeTeWe auf Sprachportale. Bei ihnen können interaktive Sprachdialoge zusammengestellt werden, um automatisiert mittels Sprache zu navigieren. „Die Sprache wird dabei nicht völlig frei per Umsetzung von Sprache in Befehle erkannt, sondern mit Hilfe einer vorher festgelegten Grammatik“, sagt Latzel. Wichtige Erfahrungen mit dem Pflegedokumentationsprogramm OPAS Sozial wurden in dem vom Bundesministerium für Familie, Senioren, Frauen und Jugend geförderten Pilotprojekt „Das intelligente Heim“ gesammelt und von Pflegewissenschaftlern ausgewertet. Bericht kann hier heruntergeladen werden.

Laut Opus Research hatte der Markt für Spracherkennung 2007 ein Volumen von 1,6 Mrd. Dollar. In den nächsten drei Jahren soll er laut dem Marktforschungsunternehmen jährlich um 14,5 Prozent wachsen. „Kein Wunder, dass nun immer mehr Firmen auf die Spracherkennungstechnik setzen“, resümiert das Handelsblatt. Der Markterfolg von sprachgesteuerten Navigationsgeräten und Handys werde auch die Systeme im telefonischen Selbstbedienungsservice beflügeln und das Image der Call Center-Branche verbessern. Davon ist der Sprachdialogexperte Bernhard Steimel überzeugt.

Bill Price auf der Call Center World in Berlin: Warum es gut ist, mit dem Kunden keinen Kontakt zu haben

Bill Price, der ehemalige Vice President of Global Customer Service von Amazon, kommt zur Call Center World nach Berlin. Bei Amazon revolutionierte er den Kundenservice mit der radikalen Philosophie „der beste Service ist kein Service“. Auf der Berliner Fachveranstaltung spricht Price beim Vorkongress-Seminars am 16. Februar 2009 sowie am Strategietag des Kongresses am 17. Februar 2009 im Hotel Estrel in Berlin-Neuköln. „Der durchschnittliche Kunde hat einfach keine Lust, seine Bank anzurufen oder seinem Online-Händler eine E-Mail zu schicken, wenn eine von ihm in Anspruch genommene Sachleistung weiterer Erklärungen bedarf oder Defizite aufweist. Stattdessen sollte alles von Anfang an klar strukturiert und problemlos verlaufen“, so die Analyse von Price. Mit dem Kauf eines Produktes soll der Kunde zufrieden sein und gar keinen Anlass finden, wieder mit dem Unternehmen in Kontakt zu treten, bestenfalls für weitere Käufe. Bei Amazon ist daher die Zahl der Kontakte pro Kundenauftrag längst eine wichtige Steuerungsgröße.

Hat der Kunde dennoch einen Grund, sich beim Unternehmen zu melden, sei es wichtig, intelligente Selbstbedienungs-Konzepte zu entwickeln. „Die These von Bill Price ist verlockend und einleuchtend zugleich: Kunden wollen keinen Service, sondern selbsterklärende und zuverlässige Produkte, die möglichst den Servicefall ausschließen oder mit schnell und einfach zu bedienenden Self Service- Angeboten kombiniert sind“, bewertet Bernhard Steimel, Sprecher der Initiative Voice Business (IVB), die Empfehlungen des ehemaligen McKinsey-Beraters Price.

Die Praxis zeigt, dass es vielen Unternehmen nicht gelingt, diesen Maßstäben gerecht zu werden. „Sie schlagen sich anscheinend lieber in ihre Kundendienst-Abteilungen mit den Auswirkungen und Symptomen schlecht konzipierter Produkte und Services herum und betätigen sich in der Brandbekämpfung, ohne die Ursachen wirklich zu beheben“, weiß Steimel, der vor allem die Servicekultur im hart umkämpften Telefonmarkt kritisch unter die Lupe nimmt. „Insbesondere bei den Festnetzanbietern bekommt man zuweilen den Eindruck, dass sie alles tun, um möglichst viele Servicevorfälle zu generieren.“

Schlechte Erreichbarkeit, unzureichend geschultes Hotline-Personal, Tarifdschungel und abmahnfähige Geschäftsbedingungen führt er als Beispiele für schlechte Serviceerlebnisse an. „All das führt schnell zu Kundenfrust. Mitarbeiter sind oftmals nicht in der Lage ein Problem am Telefon zu lösen, da sie lediglich für einfache Auskünfte, die so genannten FAQs, geschult sind, und über keine oder geringe Vollmachten verfügen, um ein Kundenanliegen schnell und unbürokratisch zu lösen,“ berichtet Steimel. Kann einem Kunden nicht geholfen werden, werde dieser versuchen, über andere Kanäle das Unternehmen zu erreichen.

„Diese Mehrfach-Kontakte, der von Price zitierte ‚Schneeballeffekt’, werden dann zum echten Problem, wenn Anfragen über unterschiedliche Eingangskanäle nicht einem Vorgang zugeordnet werden können. Diese Fähigkeit besitzen leider die wenigsten Unternehmen. Zudem gibt es oftmals keine adäquate Möglichkeit einfache Vorgänge schnell selbst zu erledigen. Wer es gewohnt ist, seine Flüge online zubuchen, den telefonischen Quick Check-In bevorzugt und Sitzplatzreservieren per SMS liebt, der hat wenig Spaß bei den meisten Angeboten der Telefonfirmen zur Selbstadministration per Telefon oder im Internet“, so Steimel.

Vor allen Dingen die Self Service-Intelligenz im Call Center müsse nach Ansicht von Lupo Pape, Geschäftsführer von SemanticEdge, deutlich gesteigert werden. Das personalisierte Dialogmanagement werde ein großes Thema der Call Center-Großveranstaltung sein: Die kundenindividuelle Vorqualifikation, Dialogführung und Weiterleitung, je nach dem welcher Kunde, wann, auf welcher Rufnummer anruft. Die optimale Mensch-Maschine-Mensch-Kommunikation unter Nutzung sämtlicher vorhandenen Informationen über den Anrufer. Zu welcher Kundengruppe gehört er, genutzte Produkte, letzter Vorfall. Offene Dialogführung anstelle starrer Dialoge – „Wie kann ich Ihnen helfen?“. „Die Personalisierung der Sprachdialoge durch die Nutzung vieler Informationen über den Kunden gleich zu Beginn und während des Dialoges könnte viele Probleme und Bedenken gegen Sprachdialogsysteme auflösen und Kunden zufriedener machen“, so der Ausblick von Pape, dessen Firma entsprechende Lösungen auf der Call Center World in Berlin vorstellen wird.

Spracherkennungssysteme im Test – 02/09-Ausgabe des IT-Magazins IX

In dem Artikel werden nach Angaben des Heise-Verlages die Produkte Dragon Naturally Speaking, Macspeech Dictate und Voice Pro (Spracherkennung) sowie Finereader, OmniPage Professional, ReadRris Pro, IRISpdf und Recognition Server (OCR) näher betrachtet. Seit dem 22. Jan. im Zeitschriftenhandel. Werde es mir besorgen und darüber berichten.

IBM-Innovationstrends: Sprechendes Internet und digitale Shopping-Assistenten

Der Gang ins Internet wird sich nach Prognosen von IBM in den nächsten fünf Jahren auf signifikante Weise verändern. Die Forscher des Computerriesen erwarten dabei viel von der Sprachsteuerung. Surfen im Internet werde mit der Stimme möglich sein – ohne Einsatz der Hände. „Dadurch werden sowohl Sichtkontakte als auch Tastaturen überflüssig. Die neue Technologie wird einen Veränderungsprozess einleiten und die Art und Weise beeinflussen, wie der Mensch mit Informationen und E-Commerce-Websites umgeht und mit ihnen interagiert. Steuerinstrument ist dann die Sprache und nicht mehr der Text. Wir wissen, dass das machbar ist, da uns bereits heute die erforderliche Technologie zur Verfügung steht, wir wissen aber auch, dass die Zeit dafür reif ist“, so IBM. In Ländern wie Indien, in denen das gesprochene Wort im Bildungswesen, in Regierungskreisen und in der Kultur eine größere Bedeutung habe als das geschriebene Wort, stellt das „Sprechen“ mit dem Internet bereits alle anderen Kommunikationsschnittstellen in den Schatten.

„Gleiches geschieht bei den Mobiltelefonen, die mittlerweile die PC-Anwendung übertrumpfen. Durch die Nutzung der ‚Voice Sites’ werden in Zukunft auch die Menschen ohne Zugang zu einem Computer oder Internet ebenso wie diejenigen, die weder schreiben noch lesen können, von den zahlreichen Vorteilen und Annehmlichkeiten des Internets profitieren“, betont IBM. Für den deutschen Markt komme es darauf an, wie man die Akzeptanz von Voice Sites steigern kann, so Christoph Bill, ITK-Leiter der Firma Vivento Customer Services in Bonn: „Bisherige Erfahrungen haben gezeigt, dass gerade in Deutschland noch erhebliche Widerstände gegenüber sprachbasierten Systemen bestehen.“ „Surfen mit der Stimme“ könnte der Sprachautomatisierung zum Durchbruch verhelfen. „Durch die Verbindung dieser Technologien mit biometrischen Verfahren könnten beispielsweise Self Service-Transaktionen im Netz deutlich an Sicherheit gewinnen“, erläutert Bill. Sprache werde mit Sicherheit als Eingabemedium an Bedeutung gewinnen, glaubt Andreas Dippelhofer, Mitglied der Geschäftsführung des Düsseldorfer Dienstleisters Acoreus. „Sprachsteuerung und Touchscreens werden bald wichtiger sein als Tastatur und Maus. Spracherkennungssysteme sind heute schon sehr zuverlässig und werden in modernen Autos erfolgreich eingesetzt.“

Eine Reduzierung der Komplexität im Netz und eine Demokratisierung des Internetzugangs werde durch personalisierte, lernfähige und vertraute elektronische Begleiter erreicht. „Sie werden dann die lästigen ersten Schritte einer Identifizierung von relevanten Informationen mittels Machine-to-Machine-Kommunikation mit einzelnen Instanzen im ‚Internet der Dinge’ aushandeln“, sagt Dippelhofer. Allerdings dürften keine technologischen Abhängigkeiten entstehen, die zu einem Verlust an Selbstbestimmung führen. Intelligente Assistenten werden auch die Shopping-Welt verändern. „Dabei wird die symbiotische Verknüpfung einer neuen Technologie und einer neuen Generation von Mobilgeräten den Einkaufserfahrungen im Einzelhandel dramatische Impulse verleihen. So werden Ankleideräume bald mit digitalen Shopping-Assistenten ausgestattet sein – Touchscreens und sprachgesteuerte Kioske werden Kunden zudem die Möglichkeit eröffnen, Bekleidungsstücke und Accessoires auszuwählen als Ergänzung oder Ersatz für die bereits zusammen gestellte Garderobe“, führt IBM aus.

Die letzte Meile im Einzelhandel werde in einigen Jahren völlig anders aussehen. „Das klassische Ladengeschäft muss nicht mehr Teil des Distributionsnetzes sein. Als Konsument möchte ich nur die allernötigsten Artikel an Ort und Stelle mitnehmen. Was darüber hinausgeht, soll mir nach Hause gebracht werden. Statt weit zu fahren, damit ich zu einem großen Sortiment komme, werde ich zu einem Showroom gehen, wo man mir das ganze Sortiment zeigt – echt oder virtuell“, sagt Moshe Rappaport, IBM- Experte für Technologie- und Innovationstrends. Es müssten nicht mehr alle Artikel im Laden vorrätig sein. Es reiche vollkommen aus, alles zeigen zu können. Nicht mehr das Produkte steht im Vordergrund, sondern der Service. „Nehmen wir Kleider als Beispiel. Ich muss nicht alle Größen in allen Farben haben. Das kann ich in einem elektronischen Dressing-Room in allen Varianten ausprobieren und meine Kaufentscheidung treffen. Komme ich nach meiner Shopping-Tour wieder ins eigene Heim, wartet das Paket schon auf mich und ich kann die Kleidung anziehen“, so der Ausblick von Rappaport.

Virtuelles Fräulein vom Amt – Sprachgesteuerte Handys als Tipping Point des Internets

Die Sprachsteuerung des iPhones mit „Google Mobile App“ http://googlemobile.blogspot.com wird von Web 2.0-Pionier Tim O’Reilly als „Tipping Point“ gewertet: Der Begriff  bezeichnet jenen Moment, in dem etwas Einzigartiges zum Normalzustand wird und einen qualitativen Umschlagspunkt markiert. „Es ist es an der Zeit, Telefone als erstklassige Geräte zu sehen, um auf das Internet zugreifen zu können, und nicht nur als Möglichkeit, Inhalte und Anwendungen umzuwidmen, die ursprünglich dazu gedacht waren, mit einer Tastatur und einem Bildschirm gelesen zu werden“, schreibt O’Reilly in seinem Blog http://radar.oreilly.com. Mit der Sprachsteuerungsfunktion werde ein neuer Weg für Computerdienstleistungen beschritten. „Apple begeisterte uns mit dem iPhone-Touchscreen, aber die Einbeziehung des Beschleunigungsmessers war fast ebenso wichtig; und jetzt hat Google uns gezeigt, wie dieser als Hauptkomponente einer Benutzeroberflächenanwendung eingesetzt werden kann. Legen Sie das Telefon ans Ohr und die Anwendung fängt an mitzuhören; eher durch eine natürliche Geste als durch ein künstliches Klopfen oder Klicken ausgelöst. Ja, der Beschleunigungsmesser wurde bereits in Spielen wie tilt oder the iPint verwendet, aber Google hat das Ganze noch etwas weiter getrieben durch die Integration des Telefon-Hauptsensors: das Mikrofon“, so O’Reilly. Nach seiner Ansicht liegt hier die Zukunft von Mobiltelefonen: eine Benutzeroberfläche zu entwickeln, die alle bisherigen Generationen über Bord wirft. Zeigen und klicken war ein Durchbruch für Computer, aber eine Sackgasse für das Design von Benutzeroberflächen.  

Mittlerweile haben das iPhone und ähnliche Smartphones eine Vielzahl an Sensoren: Mikrofon, Kamera, Touchscreen, Beschleunigungsmesser, und Standortortung. Neue Anwendungen und Kombinationen werden zu weiteren Überraschungen führen. „Künftige Geräte werden eine immer größere Anzahl an Sinnen haben, um darauf zu achten, was wir wollen. Könnte ein Telefon die Bewegung erkennen, die wir machen, wenn wir eine Kamera vor uns hochhalten, damit wir die Einstellungen festlegen können? Könnten wir mit dem Telefon reden um Kameraeinstellungen zu verändern? Könnte ein Telefon automatisch die Bewegung eines Autos erkennen und auf Sprachwahl umstellen? Und dann gibt es natürlich noch alle weitere Interaktionen mit anderen Geräten die möglich sind, wenn wir das Telefon als Steuerteil betrachten – ähnlich der Wii-Konsole von Nintendo“, erklärt O’Reilly. 

Auch in der ITK-Branche erwartet man Impulse über die Sprachsteuerung: „Computer werden heute immer noch primär über eine Tastatur bedient, die aus der Schreibmaschine entstanden ist, so als ob jeder Tastendruck einen mechanischen Hebel in Bewegung setzt. Selbst der Zeilenvorschub und Wagenrücklauf alias Carriage return ist uns erhalten geblieben, obwohl damit schon lange kein Papier mehr transportiert wird. Telefone haben zwar die Revolution von der Wählscheibe hin zur – in der Regel – 3×4 Tastatur gemacht, standardisiert nach ITU E.161, das erfolgte aber bereits in den 70er Jahren. Selbst moderne Handys und Smartphones halten sich noch an den Tastenwahlblock, entweder in mechanischer Ausführung oder als Icon-Darstellung auf einem Touchscreen“, weiß Andreas Latzel, Deutschland-Chef des ITK-Spezialisten Aastra http://www.aastra.de, der viel Wert auf die Benutzerfreundlichkeit seiner Systeme legt. Die Technikentwicklung sei zwar rasant schnell und ein gutes User-Interface inzwischen intelligent sowie kontextbezogen – im Kern aber immer noch traditionell. Vorhersehbar sei, dass der Tastaturblock an seine Grenzen stoße – spätestens mit der breiten Einführung der SIP-Telefonie und der SIP-Teilnehmeradressen.

„Anders als bei professionellen Tischgeräten kommt die Ausstattung von Handys mit alphanumerischen Tastaturen zwar auch vor, ist aber in der Regel wegen der beschränkten Abmessungen nicht befriedigend. Da bietet sich der Weg zum Sprachinterface an: der Ansage von Adressen oder Einträgen des Telefonbuchs in normaler Sprachform. Sinnvoll ist das beim Autofahren oder anderen Tätigkeiten, die beide Hände verlangen. Ein gutes Beispiel im professionellen Umfeld ist die Pflege in Altenheimen mit der Aastra-Branchenlösung OPAS. Hier kann beispielsweise mittels Telefon und Sprache die erbrachte Leistung dokumentiert werden – das Pflegepersonal gewinnt viel mehr Zeit für die Bewohner“, sagt Latzel. Übrigens schlage die Technik mit der Sprachwahl den Bogen zurück zu den Anfängen des Telefons vor der Einführung des Selbstwählsystems: damals aktivierte man den Telefonapparat durch Erzeugung einer Rufspannung über den Kurbelinduktor und sagte dem „Fräulein vom Amt“, mit welchem Teilnehmer man sprechen möchte. „Im modernen Telefon mit Sprachinteraktion wird das Fräulein von einer Software ersetzt“, so Latzel. In Kombination mit den Datenwolken von Google ergeben sich nach Prognosen von O’Reilly ungeahnte Möglichkeiten. „Sensorenreiche Geräte mit Anwendungen, die diese Sensoren nutzen, um mit Datenwolkendiensten zu interagieren und sie zu füttern. Der Standortsensor weiß, wo man sich befindet; das Mikrofon erkennt den Klang der Stimme, so dass es persönliche Daten in der Datenwolke frei setzt; die Kamera nimmt Objekte und Personen auf und sendet ein Bild zu einer abgelegenen Anwendung, die diese erkennt und die entsprechenden Informationen abruft“, führt O’Reilly aus. Viele Durchbrüche würden bereits vor der Tür stehen. Die Stimmen- und Gestenerkennung in der Google Mobile-Anwendung seien nur der Anfang. Der gleichen Meinung ist der Berliner Sprachdialogexperte Lupo Pape: „Es ist erst einmal eine Sprach- oder Diktiererkennung, die auf einer Suchmaschine und demnächst sogar auf weiteren Handyfunktionen aufsetzt. Sprachdialogsysteme werden es erst, wenn ein Wissen über die Domäne und Dialogintelligenz hinzukommen. Das ist das, was wir mit dem Personal Assistant umsetzen. Dazu müssen die Wissensgebiete semantisch aufbereitet und Dialogstrategien hinterlegt werden. Die wichtigsten Use-Cases gilt es zu modellieren“, resümiert SemanticEdge-Geschäftsführer Pape.

 

Siehe auch:

http://de.youtube.com/watch?v=y3z7Tw1K17A&eurl=http://googlemobile.blogspot.com/

http://googleblog.blogspot.com/2008/11/now-you-can-speak-to-google-mobile-app.html

 

Speak now! iPhone mit der eigenen Stimme steuern – Google-Programm wird als Meilenstein für die Durchsetzung der Sprachautomatisierung gewertet

01Jetzt ist es offiziell. Google stattet das iPhone von Apple mit einem Programm zur Sprachsteuerung aus. Das Mobile App macht es möglich, die Websuche mit der eigenen Stimme zu starten, heißt es im Mobile-Blog von Google http://googlemobile.blogspot.com. Bislang allerdings nur in englischer Sprache. Die umständliche Bedienung der Handytastatur fällt weg. In Kombination mit My Location kann man auch standortbezogene Informationen beziehen. Experten halten das für einen Meilenstein bei der Durchsetzung von Programmen für die Sprachautomatisierung. Anfang des Jahres wurde auf der Call Center World http://www.callcenterworld.de in Berlin noch darüber spekuliert, wie die Sprachdialogszene am Super-Handy bastelt: Fortschrittliche Mensch-Maschine-Schnittstellen wie Spracherkennung oder Gestensteuerung könnten aus dem Handy eine Steuerzentrale für Online-Inhalte machen und neue Geschäftsmodelle eröffnen: Sprachdialogsysteme sind nach Auffassung von Lupo Pape, Geschäftsführer des Berliner Unternehmens SemanticEdge http://www.semanticedge.de, ein wichtiger Baustein für das Super-Handy der Zukunft: „Wie häufig hätten wir gerne im Alltag genaue Informationen zu Sportergebnissen, Telefonnummern oder Adressen. Unendlich viele Dinge, die wir, wenn wir gerade im Internet wären, sofort über Google abrufen würden. Da das aber in der Freizeit und von unterwegs selten der Fall ist und der Zugriff über das Handy mit Tastatur oder Touchscreen zu mühselig ist, verzichten wir meistens darauf, unseren Wissenshunger sofort zu stillen. Anders wäre es, wenn wir mit einfachen gesprochenen Suchbefehlen unsere Anfrage starten und die Suche dann bei Bedarf eingrenzen könnten, genauso, wie wir es derzeitig mit der PC-Tastatur und Maus tun und das ganze jederzeit und von jedem Ort aus”, erklärte Pape in Berlin. Mit der Sprachsteuerungstechnik für das iPhone wird diese Vision zur Realität. Am Nutzer der frei abrufbaren Anwendung müssen nur das Telefon an ihr Ohr halten und können dann praktisch jegliche Art von Fragen stellen, wie beispielsweise „Wo finde ich den nächst gelegenen Starbucks?“ oder „Wie hoch ist der Mount Everest?” Der Sprachlaut wird in eine digitale Datei konvertiert und anschließend an die Server von Google weitergeleitet. Die Suchergebnisse schließen zum Teil lokale Informationen mit ein. Dabei nutzt man die iPhone-Funktionen für die Bestimmung des konkreten Standorts. Die Fähigkeit, fast jeden gesprochenen Satz von einer x-beliebigen Person identifizieren zu können, war lange Zeit das höchste Ziel der Forscher für Künstlichen Intelligenz. Das Management von Google hat noch nicht kommuniziert, wann der Service ausgereift sein soll. Die Verantwortlichen sagten nur, dass der Service zumindest akkurat genug ist, um den Nutzern den großen Vorteil zu bieten, nicht mehr wie bisher ihre Anfragen auf der Bildschirm-Tastatur ihres iPhones eintippen zu müssen. Der Service kann genutzt werden, um Restaurant-Empfehlungen und Anfahrtsbeschreibungen zu erhalten, oder aber um Kontaktadressen aus dem Adressverzeichnis abzurufen. Auf die Frage “Welches ist das beste Pizza-Restaurant in Noe Valley?” würde das Google-System beispielsweise mit einer Liste von drei Restaurants in der Nachbarschaft von San Francisco reagieren, jede einzelne mit Sterne-Kategorie-Beurteilungen der Google-Nutzer und weiterführenden Links, durch die man Telefonnummern und Wegbeschreibungen anklicken kann.

Für Google ist die Technologie von entscheidender Bedeutung, um den nächsten Ansturm auf die Werbewelt vorzubereiten. Das Management kommentierte dies mit der Aussage, dass man durch lokale Anfragen beispielsweise höhere Werbekostensätze von Unternehmen aus der Region verlangen könne, obgleich der Verkauf einer solchen Werbeform bisher nicht Bestandteil ihres Portfolios sei. Wie auch bei den übrigen Produkten von Google ist dieser Service für die Nutzer frei verfügbar. Außerdem plant das Unternehmen, den Service später auch anderen Telefonsystemen zur Verfügung zu stellen. „Durch die Aspekte ‘Standort’ und ‘Sprache’ erhöhen wir gegenüber den Werbeträgern den Service-Nutzen auf dramatische Weise,” erklärte Vic Gundotra, Ex-Manager von Microsoft und nunmehr verantwortlich für das Mobile Business bei Google. Gundotra wies darauf hin, dass Google es geschafft hätte, das doppelte Problem der Informationseingabe und der Informationsabfrage für mobile Endgeräte erfolgreich zu lösen. „Diese zwei zusammenhängenden Probleme auf Weltklasse-Niveau zu lösen, ist unser oberstes Ziel“, erklärte Gundotra.

Die neue iPhone-Suchmöglichkeit ist nicht das erste Sprachdialog-System von Google. Schon im März hatte das Unternehmen verlauten lassen, dass der Auskunftsdienst GOOG-411 bereits zu einem reellen Produkt herangereift sei. Die Erfahrungswerte und Dateninformationen, die es durch das GOOG-411 gewinnen konnte, wurden für die Entwicklung für das iPhone herangezogen. Die neue Dienstleistung ist nach Expertenmeinung ein gutes Beispiel dafür, wie Google es schafft, elementare Informatik-Forschung mit Produkttechnik zu verbinden. Um dies zu erreichen, wurden einige der besten Spracherkennungs-Forscher der Welt engagiert. Die Teams in New York, London und Mountain View bearbeiten die Problematik aus unterschiedlichen Blickwinkeln. Wer von den Suchanbietern das Rennen um die Hoheit beim mobilen Internet gewinnen wird, hängt nach Auffassung von Voice Days-Sprecher Bernhard Steimel http://www.voicedays.de davon ab, wer den „Kampf um die besten Köpfe“ mit der größten Marktmacht verbinden kann. „Den Kampf um die Köpfe hat Google bereits gewonnen – besonders durch die Art von Google, immer alles neu zu entwickeln und die geniale Strategie, mit GOOG411 im weltgrößten ‚Freiland-Versuch’ das eigene Sprachmodell zu validieren und mit einer exzellenten Qualität aufzuwarten“.

Siehe auch:

http://de.youtube.com/watch?v=y3z7Tw1K17A&eurl=http://googlemobile.blogspot.com/

http://googleblog.blogspot.com/2008/11/now-you-can-speak-to-google-mobile-app.html


Sprachsteuerung: Google macht das iPhone zum Super-Handy

Im Februar 2008 hatte ich schon darüber berichtet, wie die Sprachdialogszene am Super-Handy bastelt: Fortschrittliche Mensch-Maschine-Schnittstellen wie Spracherkennung oder Gestensteuerung könnten aus dem Handy eine Steuerzentrale für Online-Inhalte machen und neue Geschäftsmodelle eröffnen: Sprachdialogsysteme sind nach Auffassung von Lupo Pape, Geschäftsführer des Berliner Unternehmens SemanticEdge http://www.semanticedge.de, ein wichtiger Baustein für das Super-Handy der Zukunft: „Wie häufig hätten wir gerne im Alltag genaue Informationen zu Sportergebnissen, Telefonnummern oder Adressen. Unendlich viele Dinge, die wir, wenn wir gerade im Internet wären, sofort über Google abrufen würden. Da das aber in der Freizeit und von unterwegs selten der Fall ist und der Zugriff über das Handy mit Tastatur oder Touchscreen zu mühselig ist, verzichten wir meistens darauf, unseren Wissenshunger sofort zu stillen. Anders wäre es, wenn wir mit einfachen gesprochenen Suchbefehlen unsere Anfrage starten und die Suche dann bei Bedarf eingrenzen könnten, genauso, wie wir es derzeitig mit der PC-Tastatur und Maus tun und das ganze jederzeit und von jedem Ort aus”, erklärt Sprachdialogexperte Pape zum Start der Call Center Worldhttp://www.callcenterworld.de in Berlin. Seit Freitag wissen wir, dass das keine Hirngespinste sind. Google bringt die Sprachsteuerungstechnik auf das iPhone. 

Nutzer der frei abrufbaren Anwendung müssen nur das Telefon an ihr Ohr halten und können dann praktisch jegliche Art von Fragen stellen, wie beispielsweise „Wo finde ich den nächst gelegenen Starbucks?“ oder „Wie hoch ist der Mount Everest?“ Der Sprachlaut wird dann in eine digitale Datei konvertiert, die anschließend an die Server von Google weiter geleitet wird. Dort werden die gesprochenen Worte ermittelt, die im Anschluss daran an die Google Suchmaschine gehen. 

Die Ergebnisse dieser Suche, die in nur wenigen Sekunden auf einem schnell arbeitenden drahtlosen Netzwerk angezeigt werden können, schließen zum Teil lokale Informationen mit ein. Dabei macht man sich die Funktionalitäten des iPhones zu Nutze, über die man den konkreten Standort bestimmen kann.

Die Fähigkeit, fast jeden gesprochenen Satz von einer x-beliebigen Person identifizieren zu können, war lange Zeit das höchste Ziel der Forscher für Künstlichen Intelligenz. Ihr Bestreben galt dabei besonders dem Erforschen von Methoden, die bewirken sollen, dass die Interaktionen zwischen Mensch und Maschine zu einer Selbstverständlichkeit werden. Systeme, die mit einer solchen Fähigkeit ausgestattet sind, haben kürzlich damit begonnen, als kommerzielle Produkte die Märkte zu erobern.

Sowohl Yahoo als auch Microsoft bieten bereits Sprachdienstleistungen für Handys an. So gibt der Microsoft Tellme Service Informationen nach speziellen Kategorien, wie beispielsweise Anfahrts- und Wegbeschreibungen, Landkarten und Spielfilme wieder. Das Yahoo oneSearch System mit Spracherkennung ist im Vergleich dazu flexibler, dafür scheint es aber nicht so akkurat zu funktionieren wie das Angebot von Google. Das Google-System ist noch lange nicht perfekt und sendet beispielsweise Anfragen zurück, die wie Kauderwelsch klingen. Das Management von Google hat sich bisher zurückgehalten, Schätzungen bekannt zu geben, die besagen, wie oft der Service korrekt funktioniert. Die Verantwortlichen sagten nur, dass sie der Meinung seien, dass der Service zumindest akkurat genug ist, um den Nutzern den großen Vorteil zu bieten, nicht mehr wie bisher ihre Anfragen auf der Touchbildschirm-Tastatur ihres iPhones eintippen zu müssen.

Der Service kann genutzt werden, um Restaurant-Empfehlungen und Anfahrtsbeschreibungen zu erhalten, oder aber um Kontaktadressen aus dem iPhone Addressverzeichnis abzurufen. Genauso kann der Service dafür nützlich sein, Auseinandersetzungen in Bars zu bereinigen. Auf die Frage “Welches ist das beste Pizza-Restaurant in Noe Valley?“ würde der Service beispielsweise mit einer Liste mit drei Restaurants in der Nachbarschaft von San Francisco reagieren, jede einzelne mit Sterne-Kategorie-Beurteilungen von Google Nutzern und weiterführenden Links, durch die man Telefonnummern und Wegbeschreibungen anklicken kann.

Raj Reddy, ein Wissenschaftler der Künstlichen Intelligenz an der Carnegie Mellon University, der Pionierarbeit in der Spracherkennung geleistet hat, sagte, dass der Vorteil von Google sei, riesige Mengen an Daten zu speichern und zu analysieren. „Welches Produkt Google auch immer zum jetzigen Zeitpunkt auf den Markt bringt, wird schon in drei oder sechs Monaten signifikant an Fehlerfreiheit und Akkuratesse hinzu gewonnen haben“, erklärte Reddy.

Reddy fügte ferner hinzu: „Es ist wichtig zu verstehen, dass Spracherkennungssysteme nie richtig perfekt sein können. Die Frage sollte vielmehr lauten: bis zu welchem Punkt ist die Maschinenleistung in der Lage, sich der menschlichen Leistung zu nähern?“ Für Google ist die Technologie von entscheidender Bedeutung, um den nächsten Ansturm auf die Werbewelt vorzubereiten. Das Management von Google kommentierte dies mit der Aussage, dass man durch lokale Anfragen beispielsweise höhere Werbekostensätze von Unternehmen aus der Region verlangen könnte, obgleich der Verkauf einer solchen Werbeform bisher nicht Bestandteil ihres Portfolios sei.

Wie auch bei den übrigen Produkten Googles ist dieser Service für die Nutzer frei verfügbar. Außerdem plant das Unternehmen, den Service später auch anderen Telefonsystemen zur Verfügung zu stellen.

„Durch die Aspekte ‚Standort‘ und ‚Sprache‘ erhöhen wir gegenüber den Werbeträgern den Service-Nutzen auf dramatische Weise,” erklärte Vic Gundotra, ein ehemaliger leitender Angestellter von Microsoft, der nun das Mobile-Business bei Google leitet.

Dabei ist Google keinesfalls das einzige Unternehmen, das daran arbeitet, zukunftsweisende Spracherkennungs-Ressourcen zu erschließen. Eine so genannte Spracherwiderungstechnologie kommt schon heute regelmäßig bei telefonischen Anrufbeantwortersystemen und anderen Verbraucherdienstleistungen und -produkten zum Einsatz. Allerdings haben diese Systeme oft Schwierigkeiten mit der Komplexität von Dialogen. Außerdem offerieren sie in der Regel nur ein eingeschränktes Repertoire an Antworten auf die eingehenden Anfragen.

Vor einigen Wochen hatte Adobe seiner Creative Suite Software die von dem britischen Unternehmen Autonomy entwickelte Spracherkennungstechnologie hinzugefügt. Dadurch wurde die Möglichkeit geschaffen, Videokopien und Audio-Aufzeichnungen mit einem hohen Grad an Genauigkeit zu erstellen.

Gundotra wies darauf hin, dass Google es geschafft hätte, das doppelte Problem der Informationseingabe und der Informationsabfrage für mobile Endgeräte erfolgreich zu lösen.

„Diese zwei zusammenhängenden Probleme auf Weltklasse-Niveau zu lösen, ist unser oberstes Ziel“, erklärte Gundotra.

Die neue iPhone Suchmöglichkeit ist nicht das erste Sprach-basierte Angebot von Google. Schon im März hatte das Unternehmen verlauten lassen, dass das GOOG-411, ein experimenteller Auskunftsdienst, bereits zu einem reellen Produkt herangereift sei. Der Service eröffnet Nutzern die Möglichkeit, Geschäfts-Telefonnummern und Adressinformationen abzufragen. Google sagte, dass es sich die Erfahrungswerte und Dateninformationen, die es durch das GOOG-411 gewinnen konnte, für die Entwicklung des iPhone Services zu Nutze gemacht hätte.

Die neue Dienstleistung ist ein gutes Beispiel dafür, wie Google es schafft, elementare Informatik-Forschung mit Produkttechnik zu verbinden. Um dies zu erreichen hat das Unternehmen einige der besten Spracherkennungs-Forscher der Welt engagiert. Die Teams in New York, London und dem Hauptsitz in Mountain View bearbeiten die Problematik aus unterschiedlichen Blickwinkeln.

Ein verblüffender Teil des Gesamtdesigns der Dienstleistung wurde von einem Google-Researcher aus London beigesteuert, der eine Möglichkeit entdeckte, wie man den iPhone Akzelerometer nutzen kann — das Gerät, das per Sensortechnik erkennt, wie das Telefon gehalten wird. Die Researcher von Google erklärten, dass ein weiterer Vorteil gegenüber der Konkurrenz in der Tatsache bestehen würde, dass die Verbraucher in den vergangenen Jahren bereits Milliarden von Anfragen bei Google getätigt hätten, was allein schon für eine große Erfahrungskompetenz spräche.

„Eine Sache, die sich geändert hat, ist die heute verfügbare Berechnungsgröße und die Datenmenge“, erklärt der Sprachforscher Mike Cohen, der bevor er zu Google kam, als Mitbegründer bei Nuance Communications tätig war. Cohen empfahl darüber hinaus, dass frühere Anfragen dazu genutzt werden könnten, ein statistisches Modell zu erstellen, das demonstriert, auf welche Art und Weise Wörter häufig in einer aneinander gereihten Form auftreten. Dies ist nur eine der vielen Komponenten des Spracherkennungssystems, zu dem außerdem ein Sprachlaut-Analyse-Modell zählt ebenso wie ein Mechanismus, der es ermöglicht, die elementaren Sprachkomponenten mit tatsächlichen Wörtern zu verknüpfen.

Google hat vor kurzem ein technisches Dokument über die Entwicklung von umfangreichen Modellen zur maschinellen Übersetzung der Sprache veröffentlicht. Die Forscher schrieben dazu, dass sie das System an zwei Billionen „Informationsmerkmalen“ oder Wörtern erprobt hätten.

Hier die Demonstration des Dienstes auf Youtube: http://de.youtube.com/watch?v=GQ3Glr5Ff28


 

Forrester-Studie: Wie mangelhafte Kundenkommunikation das Geschäft ruinieren kann

Mangelhafte Anrufsteuerung und -umleitung, Unvermögen bei der Lösung von Problemen, verfehlte Übergaben und nicht funktionierende Zusammenarbeit zwischen Selbstbedienung und telefonischer Vermittlungsstelle: Das sind einige der Hauptbeschwerden der neuen Forrester Research-Studie „Warum es Ihr Geschäft ruinieren kann, mit Kunden zu sprechen“, die sowohl amerikanische Kunden als auch Service-Agenten zu Protokoll gaben. So funktioniert in vielen Firmen der automatisierte Telefonservice, dessen Aufgabe es ist, einfache Fragen zu beantworten und zeitgleich die Arbeitsbelastung der Verkaufsrepräsentanten zu reduzieren, bei weitem nicht so wie geplant. Und fast die Hälfte der 5.000 befragten Kunden bevorzugen nach wie vor die Kommunikation mit Menschen.

„Obgleich der Trend der vergangenen zehn Jahre dahin ging, Kunden aus Gründen der Kostenersparnis zu motivieren, Selbstbedienungs-Kanäle zu nutzen, bevorzugen nach wie vor immer noch 45 Prozent der Verbraucher bei Abfrage eines Kundendienstes das direkte Gespräch am Telefon mit einem Kundendienstberater“, erklärt Natalie Petuhoff, Senior Analyst von Forrester Research, gegenüber dem Magazin Speech Technology http://www.speechtechmag.com. Das System der Selbstbedienung durch automatisierte Telefonsysteme hat bei den Teilnehmern der Untersuchung den letzten Platz eingenommen. Nur zwei Prozent der Probanden favorisierte diese Variante.

Dabei ist es nach Ansicht von Petuhoff umso erstaunlicher, dass die Kernaussage der Untersuchung generationsübergreifend Gültigkeit besitzt: „Die gesamte Baby-Boom-Generation, die Generation X aber auch die Generation Y vertreten die Überzeugung, dass das direkte Gespräch mit einem Kundendienstberater eine weitaus höhere Service-Qualität besitzt als dies über andere Kundenkanäle möglich wäre.“ Und es ist nicht nur das Telefon, das bei den Kunden im Vergleich zu den Selbstbedienungskanälen die klare Favoritenposition bezieht. In der Rangfolge nach den Kundendienstberatern liegt das direkte Aufsuchen einer Geschäftsfiliale mit dem Ziel der persönlichen Beratung als bevorzugte Service-Variante – ebenfalls generationsübergreifend. Den drittletzten Platz bei den Probanden mit nur sechs Prozent Befürwortung nimmt die Korrespondenz per E-Mail ein. An zweitletzter Stelle folgt das Internet zur Informationsrecherche mit fünf Prozent. Den letzten Platz mit drei Prozent belegt das Beratungsgespräch über Chat- oder Instant Messaging-Funktion.

Die Gründe der Unzufriedenheit: Selbstbedienungskanäle werden ihren Aufgaben nicht immer gerecht; mangelhaft synchronisierte Abläufe innerhalb der Kanäle führen zu Ärger und Frustration bei den Kunden und Selbstbedienungssysteme eignen sich nicht immer dafür, Vertrauen aufzubauen. „Kunden wollen mit einem Berater sprechen, der nicht nur durch Kompetenz überzeugt, sondern zudem geduldig , freundlich, höflich und gut informiert ist, sich verständlich artikuliert und außerdem keine Verantwortung scheut, Probleme zu lösen. Leider stoßen die Kunden stattdessen oft auf Situationen, wo Probleme falsch diagnostiziert und behandelt werden und Kundenberater über eine mangelnde Servicebereitschaft verfügen. Sie müssen zahlreiche Vermittlungsschleifen zu den so genannten Experten und lange Wartezeiten während der Vermittlungen erdulden. Häufig erhalten sie unvollständige oder widersprüchliche Antworten. Darüber hinaus sehen sich die Kunden oft genötigt, dieselben Fragen und Informationen wiederholt nennen zu müssen“, erläutert Petuhoff.

Auch in Deutschland bekommt der Call Center-Kundenservice miserable Noten. Das belegt eine Umfrage des Marktforschungsinstituts Harris Interactive http://www.harrisinteractive.de im Auftrag der Software-Firma Nuance http://www.nuance.de in München. Mehr als jeder zweite Verbraucher macht mit einem Unternehmen keine Geschäfte mehr, wenn die Erfahrungen mit dessen Call Center negativ waren. 73 Prozent berichten Familienmitgliedern und Freunden von diesen Erfahrungen. Nur 12 Prozent der Befragten sind mehr als zufrieden mit dem telefonischen Kundenservice. 58 Prozent der Verbraucher gaben zu Protokoll, dass die Qualität des Kundendienstes einen sehr oder extrem großen Einfluss auf ihre Einschätzung eines Unternehmens hat. Wichtig sind vor allen Dingen die Freundlichkeit der Agenten, gefolgt vom Fachwissen der Mitarbeiter und einer schnellen Problemlösung.

Obwohl Kunden das direkte Gespräch mit einem Agenten bevorzugen, wären zwei Drittel der Befragten bereit, mit einem automatisierten System zu kommunizieren. Voraussetzung dazu ist, dass sie vorher über das System, möglichst per E-Mail, informiert wurden. Favoriten für automatisierte Systeme sind Verkehrs- und Wetterdaten, Nachrichten und Programmzeiten des Kinos. Die ständige Verfügbarkeit von Sprachcomputern wird als Hauptgrund für die Nutzung angegeben.

„Die aktuellen Umfragen belegen, dass Call Center nicht nur ein Imageproblem haben. Wenn nur gut ein Zehntel der Verbraucher mit dem telefonischen Kundenservice zufrieden ist, gibt es wohl auch gravierende Probleme beim Qualitätsmanagement. Die Call Center-Branche darf sich deshalb nicht wundern, wenn sie sich zum Prügelknaben der Nation entwickelt. Es reicht einfach nicht aus, wenn Branchenverantwortliche bei negativen Medienberichten gebetsmühlenhaft von ‚Schwarzen Schafen’ sprechen. Wo sind die ‚Weißen Schafen’“, fragt sich Bernhard Steimel, Sprecher der Initiative Voice Business. Auf dem Wiesbadener Fachkongress Voice Days http://www.voicedays.de vom 15. bis 16. Oktober 2008 werde deshalb das Thema „Branchen-TÜV“ auf die Tagesordnung gesetzt.