Wie Barkeeper-Roboter schneller reagieren können

Internationales Forschungsteam untersucht Kneipen-Kommunikation

Ein guter Barkeeper erkennt schon an den ersten Worten der Bestellung, was sein Kunde möchte. So kann er prompt reagieren. Roboter brauchen etwas länger. Um zu antworten, mussten sie bislang erst die ganze Frage anhören und analysieren. Forschende des Exzellenzclusters CITEC arbeiten mit daran, dass Roboter schon reagieren können, wenn sie nur den Satzanfang kennen. Zusammen mit Kollegen der University of the West of England und der Tufts University, USA stellen sie ihre Ergebnisse nun im Forschungsmagazin PLOS ONE vor.


In der Studie sollten Testpersonen den Barkeeper-Roboter steuern. Dafür sahen sie lediglich eine Übersicht der Daten, die ein Roboter am Tresen sammelte. Foto: CITEC/Universität Bielefeld Die Forschenden haben sich bereits in früheren Studien mit der Frage befasst, wie die Kommunikation an Kneipentheken abläuft. Für die aktuelle Untersuchung arbeiteten sie mit Wissenschaftlern in England und den USA zusammen.

„Wenn Menschen miteinander sprechen, bilden sie ständig Annahmen darüber, wie ihr Gegenüber seine Sätze zu Ende bringt“, sagt der Sprachwissenschaftler Dr. Sebastian Loth von der Forschungsgruppe Kognitive Systeme und soziale Interaktion, die zur Technischen Fakultät und zum Exzellenzcluster CITEC gehört und von Professor Dr. Stefan Kopp geleitet wird. Loth forscht seit mehreren Jahren an der Frage, was ein Roboter von menschlicher Kommunikation verstehen muss, um Kunden an der Theke zu bewirten. „Wenn wir nicht erst das Ende eines Satzes abwarten müssen und frühzeitig voraussagen können, was der Gesprächspartner sagen will, können wir schneller antworten und auf die Wünsche des anderen reagieren“, sagt Loth.

 „Service-Roboter arbeiten mit automatischer Spracherkennung. Solche Software analysiert die Äußerungen von Sprechern normalerweise erst dann, wenn sie abgeschlossen sind. Wir verwenden hingegen eine inkrementelle Spracherkennung. Sie analysiert den Satz Schritt für Schritt, sobald das erste Wort gesprochen wird. Das erhöht aber die Wahrscheinlichkeit, dass sie Worte falsch versteht.“

Das Forschungsteam will Service-Robotern die Fähigkeit vermitteln, Äußerungen von Kunden möglichst schnell zu verstehen. Dafür hat das Team Versuchspersonen gebeten, sich in die Rolle eines Barkeeper-Roboters zu versetzen. 16 Testpersonen hatten in je 12 Durchgängen die Aufgabe, den Roboter fernzusteuern. Sie befanden sich in einem anderen Raum als der Roboter und seine Kunden. Die Personen saßen an einem Computerbildschirm und erhielten eine Übersicht der Daten, die ein Roboter am Tresen sammelte. So konnten sie zum Beispiel erkennen, wenn sich ein Kunde näherte. Wenn der Kunde etwas sagte, wurde in Echtzeit eingeblendet, wie die Maschine die Worte deutete.

Serviceroboter als Barkeeper: Die Forschenden untersuchen, was ein Roboter von menschlicher Kommunikation verstehen muss, um Kunden an der Theke zu bewirten. Foto: fortiss GmbH Auf Grundlage dieser Daten sollten die Testpersonen per Mausklick den Roboter eine von rund 20 möglichen Handlungen ausführen lassen. So konnten sie ihn etwa anweisen, die aktuelle Getränkeauswahl zu nennen, eine Frage zu stellen oder ein Wasser zu servieren. Eine besondere Beschränkung war, dass der Roboter einmal servierte Getränke nicht zurücknehmen konnte. „Wir wollten so herausbekommen: Ab wann sind die Testpersonen bereit, dem Roboter zu sagen, was er tun soll“, sagt Loth. „Warten sie erst den ganzen Satz ab? Reichen ihnen die ersten Worte?“
Das Ergebnis: „Die Versuchspersonen entscheiden, wie hoch die Fehlerkosten sind. Sie wägen bei unsicheren Angaben also ab, wie groß die Probleme werden, wenn sie sich vertun“, sagt Sebastian Loth.

Beginnt eine Kundin an der Theke ihren Satz mit „Was …“, möchte sie mit hoher Wahrscheinlichkeit wissen, welche Getränke im Angebot sind. Die meisten Testpersonen ließen den Roboter reagieren, ohne den Rest des Satzes zu kennen. „In diesem Fall ist es unproblematisch, wenn der Roboter antwortet, ohne dass die Testperson den Satz zu Ende gehört hat. Wenn die Antwort falsch ist, würde das die Kundin schlimmstenfalls irritieren“, sagt Loth.

Anders ist die Situation, wenn eine konkrete Bestellung aufgegeben wird. Wenn die Testpersonen Satzanfänge wie „Ich hätte gerne …“ oder „Ich möchte …“ lasen, warteten sie meistens ab, bis sie den vollständigen Satz vor sich hatten. „In diesem Fall wäre eine falsche Reaktion, schwierig zu beheben. Denn ein falsch serviertes Getränk konnte ja nicht zurückgenommen werden.“ In Fällen, in denen die angezeigten Sätze der Kunden zu kryptisch waren, sicherten sich die Testpersonen ab, indem sie Rückfragen stellten.

CITEC-Forscher Dr. Sebastian Loth arbeitet daran, menschliche Fähigkeiten auf Barkeeper-Roboter zu übertragen. „In der Praxis können die Forschungsergebnisse dazu beitragen, dass Serviceroboter oder auch Avatare auf Computerbildschirmen künftig natürlicher kommunizieren, wenn sie ihre menschlichen Gesprächspartner nicht allzu lange auf die Antwort warten lassen“, sagt Loth.

Die Studie baute auf der Forschung des EU-Projekts „James“ auf. In diesem Projekt kooperierte die AG Psycholinguistik der Universität Bielefeld, die von Professor Dr. Jan de Ruiter geleitet wurde, mit europäischen Partnern wie der University of Edinburgh in Großbritannien. In einer früheren Studie hatten die Wissenschaftlerinnen und Wissenschaftler des Projekts herausgefunden, dass Barkeeper vor allem auf Körpersprache achten, um zu erkennen, wer bedient werden will. Für die aktuelle Studie kooperierten Forschende des Exzellenzclusters CITEC, der University of the West of England und der Tufts University, USA.

Originalveröffentlichung:
Sebastian Loth, Jettka K, Giuliani M, Stefan Kopp, Jan de Ruiter: Confidence in uncertainty: Error cost and commitment in early speech hypotheses. PLOS ONE. https://doi.org/10.1371/journal.pone.0201516, erschienen am 1. August 2018.

Weitere Informationen:
„Warum Barkeeper manche Signale ignorieren müssen“ (Pressemitteilung vom 13.11.2015): https://bit.ly/2vMYwiG
„Zum Forschen in die Kneipe“ (Pressemitteilung vom 9.09.2013): https://bit.ly/2vpa7VO
James-Projekt: www.james-project.eu  

Kontakt:
Dr. Sebastian Loth, Universität Bielefeld
Exzellenzcluster Kognitive Interaktionstechnologie (CITEC) / Technische Fakultät
Telefon: +49 521 106-67505
E-Mail: sebastian.loth@uni-bielefeld.de