We help you find the perfect fit.

Swiss Ai Research Overview Platform

Learning to Interact with Humans by Lifelong Interaction with Humans

Lay summary

Inhalt und Ziel des Forschungsprojekts:

Im Rahmen des LILITH-Projektes wird erforscht wie ein Dialogsystem durch Interaktionen mit Menschen im Laufe der Zeit immer besser werden. Die Idee ist, dass das System Rückmeldungen erhält, wie gut es eine Aufgabe lösen konnte, und so lernt komplexe Aufgaben immer besser zu lösen – oder gar ganz neue Aufgaben dazulernt. Das Projekt vereint verschiedene Forschungs-Disziplinen: Verarbeitung von natürlicher Sprach, Wissens-Induktion, Reinforcement-Learning, Deep Learning und Life-long Learning.

Das Ziel ist es intelligente Systeme zu entwickeln, welche sich durch die Interaktion mit Menschen verbessern. Im Detail werden wir drei Bereiche erforschen: 1) lebenslanges Lernen im Bereich von Dialogen; 2) lebenslanges Lernen für Wissens-Induktion und für automatische Frage-Antwort Systeme; und 3) Evaluation von Dialogsystemen, um neue Methoden für die Qualitätsbewertung von Dialogen zu finden.

Wissenschaftlicher und gesellschaftlicher Kontext des Forschungsprojekts:

 Durch dieses Projekt werden neue Methoden für lebenslanges Lernen entwickelt, um die Qualität von Dialogsystemen zu erhöhen. Dadurch sollen diese Technologien in den Markt gelangen, die die Art und Weise verbessern wie wir Menschen mit den Maschinen interagieren. 

Abstract

The LIHLITH project is a fundamental pilot research project which introduces a new lifelong learning framework for the interaction of humans and machines on specific domains. A Lifelong Learning system learns different tasks sequentially, over time, getting better at solving future related tasks based on past experience. LIHLITH will focus on human-computer dialogue, where each dialogue experience is a task that the system uses to learn to interact better, based on the success (or failure) of previous interactions. The key insight is that the dialogue will be designed to produce a reward, allowing a chatbot system to know whether the interaction was successful or not. The reward will be used to train the domain and dialogue management modules of the chatbot, improving the performance, and reducing the development cost, both on a single target domain but specially when moving to new domains. The research will be evaluated on publicly available benchmarks to allow comparison with other approaches in the state of the art. When possible, systems will participate in international comparative/competitive evaluations such as WOCHAT, SemEval or QALD. LIHLITH project will also develop and deliver evaluation protocols and benchmarks to allow public comparison and reproducibility. The industrial partner will transfer the research into technology, applying the lessons learnt to the development of chatbots for customer support. LIHLITH will rely on recent advance in multiple research disciplines, including, natural language processing, speech processing, knowledge induction, reinforcement learning, deep learning, and lifelong learning.

Mark Cieliebak