„Vous êtes mon ami“: Die Kempelen-Wundermaschine und Sprachdialog-Systeme für Kundenservice #gforce13

Kempelen und die Sprechmaschine

Wird über Sprachautomatisierung debattiert, fallen sicherlich jedem Konsumenten sofort eine Reihe nerviger Hotline-Ansagetexte ein, die den Blutdruck in Wallung bringen. Legendär hat das der Werbefilm von Yello Strom auf die Schippe genommen mit dem roboterhaften Obstverkäufer: „Interessieren Sie sich für unsere Bananen, sagen Sie ‚Bananen’……“

Den Forschungsarbeiten für die künstliche Nachahmung menschlicher Stimmen wird das nicht gerecht. So war schon im 18. Jahrhundert der Hofkammerrat Wolfgang von Kempelen unter Maria Theresia und ihres Sohnes Joseph II. davon beseelt, eine Sprechmaschine zu erfinden, die dem Menschen nützt: Der aufklärerisch gesinnte Beamte konstruierte einen Apparat, der gehörlose Menschen zur Lautsprache führen konnte. Die Maschinen-Sprache sollte nicht nur hörbar, sondern vor allem für das Auge verständlich werden.

Kempelen äußerte sich optimistisch, „dass die Maschine ohne sonderliche Kunst mit Tasten, wie ein Klavier oder eine Orgel einzurichten wäre, dass Spielen auf derselben, gegen die dermalige Art Jedermann viel leichter fallen würde“, berichtet 1792 das „Magazin für das Neueste aus der Physik und Naturgeschichte“ (Band 8, Seite 101). Das mechanische Stimm-Wunder funktionierte sogar polyglott und beglückte das staundende Publikum mit Sätzen wie „vous êtes mon ami – je vous aime de tout mon Cœur“. Es glänzte auch in lateinischer Sprache: „Leopoldus Secundus – Romanum Imperator – Semper Augustus“.

Forschung im 18. Jahrhundert

Die Idee, dass ein lebendiger Organismus nach physikalischen Gesetzen funktioniert und prinzipiell mit Mitteln der Mechanik simuliert werden kann, war spätestens seit dem 17. Jahrhundert nicht länger unklar und verdächtig, sondern wissenschaftliche Hypothese. Die Pionierarbeit von Kempelen wirkte bis ins 20. Jahrhundert auf Persönlichkeiten wie Charles Babbage, dem „Father of computing“, Homer Dudley, der den Voice Operation Demonstrator (VODER) baute oder auf Mathematiker wie John von Neumann und Norbert Wiener, die sich mit Sprache und Logik beschäftigten.

Durch die Sprachsteuerung per Computer ist die mechanische Kempelen-Konstruktion heute nicht mehr relevant.

„Wissenschaftsgeschichtlich jedoch ist es nach wie vor von Bedeutung, ebenso seine Ansichten und seine philosophische Betrachtungsweise“, erläutert die Kempelen-Expertin Alice Reininger von der Universität für angewandte Kunst in Wien.

G-Force in Wien

Die natürliche Sprache zur Steuerung von Geräten, beim Diktieren von Texten und zur Abfrage von Standardinformationen zu nutzen, ist längst Realität und funktioniert erstaunlich gut, auch wenn viele Hotline-Betreiber immer noch auf die veralteten Tastenwahl-Systeme „Drücken Sie die 1, 2 oder 3“ setzen.

„Viele Firmen haben die Kosten gescheut und sich auf das Drücken von Knöpfchen konzentriert. Aber immer mehr entscheiden sich für Sprachdialog-Systeme. Der Kunde erwartet personalisierte Services. Und wenn er dann schon mit der einer Maschine reden soll, dann sollte es auch zu Ergebnissen führen. Beim Knöpchen drücken ist das eben nicht der Fall, weil die dahinter liegende Struktur ein Spiegel der inneren Organisation des Kundendienstes ist“, erläutert Heinrich Welter von HFN Medien auf der Technologiekonferenz G-Force in Wien.

In welches Schubfach der Anbieter welchen Service gelegt hat, könne der Kunden bei den alten Systemen nur mit einem Ratespiel beantworten.

„Bei einer Sprachdialog-Anwendung kann ich das konkreter äußern. Ich habe ein Problem mit dem Rechnungsbetrag oder der Rechnungsadresse oder mit der Rechnung generell. Bei den Tastenkombinationen kann man das nicht genau eintüten“, so Welter.

Sprachsteuerung werde immer populärer durch die Erfolge von Apple und Google.

„Die Spracherkennung ist wesentlich besser geworden. Die Hardware ist mittlerweile nicht mehr so teuer und auch die smantischen Analyseverfahren, um den Sinnzusammenhang von Sprache zu deuten, wurden verfeinert. Auf dieser Basis gibt es jetzt Standard-Angebote, die für die Unternehmenswelt erschwinglich sind – ohne großen Schulungs- und Anpassungsbedarf wie früher“, betont der Service-Experte.

Mit dem Voice Content Management sei das ohne Expertenwissen beherrschbar – ohne das Gängelband der Tastenwahl. Interessante Einsatzmöglichkeiten sieht Welter bei der mobilen Kommunikation über Applikationen – etwa die Identitätsüberprüfung via Stimme. Auf Passworte könne man dann verzichten:

„Ist die Überprüfung abgeschlossen kann ich meiner App über die Sprachsteuerung sagen, was sie machen soll. Das ist bei kleinen Geräten mit den Beschränkungen der Tastatur ein großer Vorteil und erleichtert die Navigation.“

Generell gebe es noch sehr viel Nachholbedarf, die Personalsiierung in der Werbung und im Service zu einem echten Erlebnis zu machen.

Das zog sich wie ein Roter Faden durch die Sessions der diesjährigen G-Force in Wien.

G-Force Session in Wien

Besonders in der Service-Kommunikation hapert es immer noch am Wissensmanagement, um an jedem Kontaktpunkt das gleiche Kundenerlebnis hervorzubringen und die Silos der internen Organisation abzubauen, so das Credo von Genesys-Vorstandschef Paul Segre.

Das mechanische Kempelen-Meisterwerk kann man übrigens im Deutschen Museum in München bewundern.

„Sagen Sie ‚Bananen'“: Warum Sprachcomputer Prozesse automatisieren sollten und nicht Menschen – Auf den Spuren von Hofkammerrat Kempelen

Wird über Sprachautomatisierung debattiert, fallen sicherlich jedem Konsumenten sofort eine Reihe nerviger Hotline-Ansagetexte ein, die den Blutdruck in Wallung bringen. Trefflich auf die Spitze getrieben im Werbefilm von Yello Strom am Obststand mit dem roboterhaften Verkäufer und seinem Ansagetext: „Interessieren Sie sich für unsere Bananen, sagen Sie ‚Bananen’……“ Dem Stand der Forschung und dem Ansinnen der Wissenschaftler werden die endlos kolportierten Negativbeispiele nicht gerecht. Schon im 18. Jahrhundert war der Hofkammerrat Wolfgang von Kempelen unter Maria Theresia und Joseph II. davon beseelt, eine Sprechmaschine zu erfinden, die dem Menschen nützt: Der aufklärerisch gesinnte Beamte konstruierte einen Apparat, der gehörlose Menschen zur Lautsprache führen konnte. Die Maschinen-Sprache sollte nicht nur hörbar, sondern vor allem für das Auge verständlich werden. Kempelen äußerte sich optimistisch, „dass die Maschine ohne sonderliche Kunst mit Tasten, wie ein Klavier oder eine Orgel einzurichten wäre, dass Spielen auf derselben, gegen die dermalige Art Jedermann viel leichter fallen würde“, berichtet 1792 das „Magazin für das Neueste aus der Physik und Naturgeschichte“ (Band 8, Seite 101).

Die Idee, dass ein lebendiger Organismus gemäß den Gesetzen von Physik funktioniert und prinzipiell mit Mitteln der Mechanik simuliert werden kann, war spätestens seit dem 17. Jahrhundert nicht länger unklar und verdächtig, sondern wissenschaftliche Hypothese. Die Pionierarbeit von Kempelen wirkte bis ins 20. Jahrhundert: auf Persönlichkeiten wie Charles Babbage, dem „Father of computing“, Homer Dudley, der den Voice Operation Demonstrator (VODER) baute oder auf Mathematiker wie John von Neumann und Norbert Wiener, die sich mit Sprache und Logik beschäftigten. Durch die Sprachsteuerung per Computer ist das Kempelen-Werk sicherlich nicht mehr relevant. „Wissenschaftsgeschichtlich jedoch ist es nach wie vor von Bedeutung, ebenso seine Ansichten und seine philosophische Betrachtungsweise“, erläutert die Kempelen-Expertin Alice Reininger von der Universität für angewandte Kunst in Wien.

Auch heute gehe es nach Ansicht von Andreas Latzel, Deutschlandchef der Aastra-Gruppe, bei der Sprachtechnologie um einen humanitären Ansatz: „Es sollen Prozesse automatisiert werden und nicht Menschen“. Als Beispiel nennt er die Altenpflege. Die von seiner Firma entwickelte Technik soll Pflegedokumentationen in der stationären Altenhilfe einfacher, schneller und besser machen: „So ist eine Nachtschwester für viele Bereiche und Bewohner zuständig und kann nicht alle Akten ständig bei sich tragen. Die Spracherfassung über das mobile Telefon vereinfacht die Dokumentation, sichert die Qualität und spart nebenbei noch Zeit“, sagt Latzel.

Wichtige Erfahrungen mit dem Aastra-Programm OPAS Sozial wurden in dem vom Bundesministerium für Familie, Senioren, Frauen und Jugend geförderten Pilotprojekt „Das intelligente Heim“ gesammelt und von Pflegewissenschaftlern ausgewertet: „Mithilfe der Spracherkennung wird deutlich mehr direkt und zeitnah im Anschluss an die Pflegeleistung dokumentiert. Der Anteil der Personen, die direkt im Anschluss an Maßnahmen dokumentieren, ist von 46 auf 70 Prozent gestiegen. Unter Berücksichtigung des deutlich gestiegenen Dokumentationsvolumens hat die eigentliche Dokumentationszeit abgenommen. So geben über 73 Prozent der Befragten an, bei der Dokumentation mit Spracherkennung deutlich Zeit zu sparen“, so der vorläufige Abschlussbericht.

Über 93 Prozent der beteiligten Mitarbeiter gaben zu Protokoll, dass die Dokumentationsanwendung mit Spracherkennung leicht bedienbar sei. 90 Prozent der Pflegekräfte wollen mit dem Prototyp oder einem ähnlichen System weiterarbeiten. 85 Prozent der Umfrageteilnehmer würden die Dokumentation mittels Spracherkennung anderen Dokumentationsmethoden vorziehen. Eine funktionierende Spracherkennung unterstütze die Dokumentation, so dass zahlreiche Einsatzgebiete der Spracherkennung – weit über die Erstellung des Verlaufsberichts hinaus – denkbar seien. „70 Prozent der Pflegekräfte geben an, dass das Dokumentationsvolumen und die Dokumentationsqualität im Rahmen der Dokumentationsarbeit mit der Spracherkennung deutlich gestiegen sind. Dies wird auch durch die entsprechenden Leiter der Heimträger bestätigt“, so das Fazit der Pflegewissenschaftler. Auf der Call Center World in Berlin wird Aastra branchenspezifische Lösungen vorstellen, unter anderem das multimediale Sprachdialogsystems Aastra Voice Portal 7.5. Nach Firmenangaben versteht es umgangssprachliche Äußerungen ebenso wie komplette Sätze und lässt sich jederzeit unterbrechen. Darüber hinaus werden die Antworten anhand des bisherigen Dialogverlaufs und der jeweiligen Aufgabenstellung generiert. Sind beispielsweise im Kino Filme noch nicht angelaufen oder keine Karten mehr verfügbar, werden Anrufer frühzeitig informiert und müssen sich nicht erst durch die gesamte Dialogstruktur quälen – wie bei menügesteuerten Systemen.