Towards Goal-Oriented Agents for Evolving Problems Observed via Conversation

要約

この研究の目的は、チャットボットが直接観察できない問題についてユーザーと会話することで、進化する問題を解決できるチャットボットを訓練することです。
このシステムは、仮想問題 (この場合は単純なゲーム)、問題を観察してアクションを実行できる自然言語の質問に答えることができるシミュレートされたユーザー、および Deep Q-Network (DQN) ベースのチャットボット アーキテクチャで構成されます。
チャットボットは、強化学習を使用してシミュレートされたユーザーとの対話を通じて問題を解決することを目的としてトレーニングされます。
この論文の貢献は次のとおりです: 対話型 DQN ベースのエージェントを進化する問題に適用するための提案されたアーキテクチャ、モデルのパフォーマンスに対するカリキュラム学習などのトレーニング方法の調査、および環境の複雑さが増加した場合の修正された報酬関数の影響

要約(オリジナル)

The objective of this work is to train a chatbot capable of solving evolving problems through conversing with a user about a problem the chatbot cannot directly observe. The system consists of a virtual problem (in this case a simple game), a simulated user capable of answering natural language questions that can observe and perform actions on the problem, and a Deep Q-Network (DQN)-based chatbot architecture. The chatbot is trained with the goal of solving the problem through dialogue with the simulated user using reinforcement learning. The contributions of this paper are as follows: a proposed architecture to apply a conversational DQN-based agent to evolving problems, an exploration of training methods such as curriculum learning on model performance and the effect of modified reward functions in the case of increasing environment complexity.

arxiv情報

著者 Michael Free,Andrew Langworthy,Mary Dimitropoulaki,Simon Thompson
発行日 2024-01-11 10:38:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク