Banner Online Kompaktkurse für fundiertes Wissen zu neuesten Gesesetzesänderungen und Abrechnungskriterien
Abo

Interview : Reisekosten-Chatbots: KI hilft verstehen, aber nicht beantworten

Chatbots sind im Zuge der Weiterentwicklung generativer künstlicher Intelligenz (KI) noch einmal populärer geworden auch im HR-Bereich. Doch noch immer sind regelbasierte Anwendungen oder Mischformen statt rein KI-gestützter Anwendungen im Einsatz, und das mit gutem Grund, wie ein Forscher*innenteam von der Universität Stuttgart erklärt. Prof. Dr. Ngoc Thang Vu, Lindsey Vanderlyn und Dirk Väth wissen dabei genau, wovon sie sprechen, denn sie haben schon 2020 für ihre eigene Universitätsverwaltung einen Reisekosten-Chatbot entwickelt.

Alexandra BubaFokus
Lesezeit 4 Min.

Herr Prof. Dr. Ngoc Thang Vu, Sie haben mit Ihrem Team in einem vergleichsweise ungewöhnlichen Unterfangen als Wissenschaftler* innen eine Anwendung für die eigene Verwaltung entwickelt wie kam es dazu?

Prof. Dr. Ngoc Thang Vu: Wir hatten zuvor bereits innerhalb von zwei Jahren ein Framework für Dialogsysteme fertig entwickelt und wollten es für etwas Sinnvolles benutzen. Ich habe daraufhin all meine Doktoranden zusammengerufen, und wir haben gemeinsam überlegt, wo sie Möglichkeiten sehen, Studierende zu unterstützen. Zudem gab es noch das Agility Lab, in dem Angestellte des Kanzlers zusammenkamen, um mit der Verbesserung von Universitätsprozessen zu experimentieren. Aus vielen Vorschlägen kristallisierte sich der Bedarf der Reisekostenstelle als sehr groß heraus, da dort viele Fragen und mehr oder weniger gleich geartete E‑Mails ankommen.

Es gibt also offenbar tatsächlich einen großen Nutzen für einen Chatbot in der Reisekostenabrechnung. Nachdem dies feststand: Wie ging es dann weiter?

Lindsey Vanderlyn: Als interner Kunde und Bedarf klar waren, begannen wir mit der Reisekostenstelle die häufigsten Fragen zu sammeln um im Übrigen erst anschließend zu entscheiden, welches System besser geeignet ist: ein FAQ-Katalog oder doch ein Chatbot? Nach einer Nutzerstudie kamen wir zu dem Schluss, dass ein FAQ-Katalog nicht ausreicht, weil es bei Reisekosten in der Regel nicht um einzelne Fragen geht, sondern um verbundene Themen. Daher sind die Antworten oftmals lang und manche Frage-Antwort-Paare einfach nicht passend im Hinblick auf die spezifische Situation.

Dirk Väth: Ein sogenanntes Retrieval Based System, also der klassische FAQ-Katalog, kann mehr als eine Antwort ausgeben, die Aussagen können dabei widersprüchlich sein, und die Nutzer*innen müssen dann im Zweifelsfall entscheiden, welche die für sie passende ist. Die Genauigkeit kann auch problematisch sein, etwa schon bei der Frage, ob eine Dienstreise innerhalb Deutschlands verläuft oder eben nicht. Deshalb haben wir uns für ein regelbasiertes Dialogsystem entschieden, das Rückfragen stellen kann und damit präzisere Antworten erlaubt.

Daher also der Chatbot doch wie gelangte das fachliche Know-how hinein?

Prof. Dr. Vu: Das ist generell eine der wichtigsten Fragen. Denn während unserer Arbeit wurde uns klar, dass wir ein System brauchen, das die Fachleute selbst aktualisieren können wenn sich zum Beispiel Tagessätze ändern. Daher haben wir einen Dialogeditor quasi für die andere Seite des Schreibtisches entwickelt, der nicht technische ausgebildete Fachleute in die Lage versetzt, einen Chatbot nach ihren Bedürfnissen zu bauen oder zumindest an sich ändernde Rechtslagen anzupassen.

Vanderlyn: Die Reisekostenstelle hat sehr viel Know-how eingebracht, dazu muss man sagen, dass durch Corona und eine eingeschränkte Reisetätigkeit die notwendigen zeitlichen Ressourcen vorhanden waren, da hatten wir insofern einen glücklichen Zeitpunkt für unsere Arbeit erwischt. Dennoch hat es zwei Jahre gedauert, bis der Prototyp fertig war; das System ist im Übrigen seitdem im Einsatz und wird von uns intern weiterentwickelt.

Auch im Hinblick auf KI?

Dirk Väth: Wir wägen ab, wie generative KI momentan Vorteile bringen kann. Denn im Vergleich zum regelbasierten Chatbot der vorgegebene Antworten aus einem strukturierten System liefert kann KI plötzlich falsche Informationen erfinden oder den Kontext wechseln, ohne dass Nutzer*innen dies mitbekommen, und auf einmal beziehen sich Antworten dann doch auf eine Inlandsreise, obwohl zuvor von einer Auslandsreise die Rede war. Unsere bisherigen Ergebnisse lassen sich vielleicht so zusammenfassen: KI nützt beim Verständnis von Nutzerfragen, aber bei ihrer Beantwortung muss man noch auf die Korrektheit der generierten Antworten achten.

Weil KI nicht zuverlässig ist und dies gerade im Reisekostenbereich ein No-Go ist?

Prof. Dr. Vu: Genau, wenn Sie einmal eine falsche Antwort bekommen haben, vertrauen Sie dem System zu Recht nicht mehr. Ich bin aber trotz aller limitierenden Faktoren, die wir derzeit sehen, sehr zuversichtlich, dass die Forschung Lösungen für die Probleme der Large Language Models finden wird. Einen Zeithorizont dafür anzugeben, ist schwierig, doch ich denke, dass sich über kurz oder lang wahrscheinlich eine Kombination von Systemen also regelbasierte Systeme und generative KI durchsetzen wird. Derzeit setzt die Industrie noch oftmals auf regelbasierte Systeme, soweit ich das beurteilen kann. Sie sind momentan deutlich zuverlässiger, können aber eben auf Unerwartetes nicht adäquat reagieren.

Worauf kommt es Ihrer Einschätzung nach generell auch bei kommerziellen Anbietern bei einem Reisekosten-Chatbot an?

Prof. Dr. Vu: Auf drei Faktoren: Zuverlässigkeit, Komfort und Wartbarkeit. Daran arbeiten im Übrigen auch wir immer weiter, da wir unseren Chatbot perspektivisch auch anderen Universitäten anbieten wollen.

Vanderlyn: Ein Chatbot braucht immer Fachleute aus dem HR-Bereich, da sich die Informationen laufend ändern. Daher muss er so gestaltet sein, dass ihn nicht nur technisch Versierte bauen können oder alle mal eben programmieren lernen müssen, sondern so, dass Nutzer*innen ihn über eine grafisch gestaltete Oberfläche leicht an ihre Bedürfnisse anpassen können.

 

Eine Person mit Brille, weißem Hemd, gemusterter Weste und Krawatte steht draußen vor einem verschwommenen grünen Hintergrund. Sie scheint bereit, mit ihrem Reisekosten-Chatbot zu interagieren und genießt dabei die ruhige Umgebung.

Prof. Dr. Ngoc Thang Vu ist Lehrstuhlinhaber Digitale Phonetik, Stiftungsprofessur der Carl-Zeiss-Stiftung, Institut für maschinelle Sprachverarbeitung an Universität Stuttgart.

Eine Person mit zurückgebundenen langen Haaren lächelt in die Kamera und verkörpert einen fröhlichen Reisekosten-Chatbot in Menschengestalt. Sie trägt ein helles, ärmelloses Oberteil. Auf einem Holzregal im Hintergrund stehen ein kleines weißes Deko-Objekt und ein gerahmtes Bild, was der Szenerie einen einladenden Charme verleiht.

Lindsey Vanderlyn ist Doktorandin am Institut für maschinelle Sprachverarbeitung und digitale Phonetik der Universität Stuttgart.

Eine Person mit Brille und blauer Jacke mit grünem Futter lächelt in die Kamera und strahlt die Wärme eines Reisekosten-Chatbots aus. Der unscharfe Hintergrund lässt eine Außenkulisse unter bedecktem Himmel vermuten.

Dirk Väth ist ebenfalls Doktorand am Institut für maschinelle Sprachverarbeitung und digitale Phonetik der Universität Stuttgart.

Diesen Beitrag teilen: